有时,我们会碰到这样一些代码:依赖平台的默认字符集。
在windows上开发项目,我们使用的操作系统windows一般默认字符集是GBK;但是部署到linux上就会出现乱码问题。这个时候就蛋疼了,假如A系统希望linux平台的默认字符集是UTF-8,B系统则希望linux平台的默认字符集是GBK,怎么搞?比如下面的一段代码:
/** * 字节数组转化为字符串 */ public String bytesToString(byte[] bytes) { // 错误写法,依赖于平台的默认字符集,换个平台可能就是乱码 // return new String(bytes); // 正确写法 return new String(bytes, "UTF-8"); } /** * 字符串转化wield字节数组 */ public bytes[] StringToBytes(String content) { // 错误写法,依赖于平台的默认字符集,换个平台得到的字节数组可能就不正确了 // return content.getBytes(); // 正确写法 return content.getBytes("UTF-8"); }
还有就是从网络接口读取字节流转化为字符流,最好指定字符集。
好的编程习惯就是:不要让代码依赖于平台的默认字符集,指定一个明确的字符集,当然两个方向转化的字符集要一致(字符流到字节流,字节流到字符流)。
原文:http://my.oschina.net/u/2007041/blog/392859