(一)获取用于网络的utf-8编码。(北京:%e5%b9%bf%e5%b7%9e)
经分析,是“汉字”两个中文字符通过UTF8编码,转换为字节数组,再通过单字节格式化,转换为16进制数的结果。
解析代码如下,
try{
// TODO Auto-generated method stub
String city="广州";
byte b[]=city.getBytes("utf-8");
String str="";
for(int i=0;i<b.length;i++){
str=str+"%"+Integer.toHexString(b[i]).substring(6);
}
System.out.println(str);
}
catch(Exception e){}
(二)读txt文件
byte[] buf=new byte[1000*1024];
InputStream in=getAssets().open("rss.txt");
in.read(buf);
String f[]=EncodingUtils.getString(buf,"GB2312").split("\n");
(三)读utf-8文件(按行读)
BufferedReader br=new BufferedReader(new InputStreamReader(conn.getInputStream(),"utf-8"));
本文介绍如何使用Java获取字符串的UTF-8编码形式,并提供了两种读取文件的方法:一种是从TXT文件中读取GB2312编码的内容;另一种是逐行读取UTF-8编码的文件。
9875

被折叠的 条评论
为什么被折叠?



