预备知识:
1.字节与unicode
【相关文章:Java技术与XML常见问题之JAX-R】 【扩展阅读:Java语言与C语言的不同点】java内核是unicode的,就连class文件也是,但是很多媒体,包括文件/流的保存方式是使用字节流的。 因此java要对这些字节流经行转化。char是unicode的,而byte是字节.java中byte/char互转的函数在sun.io的包中间有。其中bytetocharconverter类是中调度,可以用来告诉你,你用的convertor。其中两个很常用的静态函数是。 【扩展信息:经典java问题,你能答出几个?】public static bytetocharconverter getdefault() ; public static bytetocharconverter getconverter(string encoding); 如果你不指定converter,则系统会自动使用当前的encoding,gb平台上用gbk,en平台上用8859_1 我们来就一个简单的例子: "你"的gb码是:0xc4e3 ,unicode是0x4f60 你用: encoding="gb2312"; byte b[]={(byte)\u00c4,(byte)\u00e3}; convertor=bytetocharconverter.getconverter(encoding); char [] c=converter.convertall(b); for(int i=0;i 打印出来是0x4f60 但是如果使用8859_1的编码,打印出来是 0x00c4,0x00e3 例1 反过来: encoding="gb2312"; char c[]={\u4f60}; ... 下一页