Java byte[]转换成String 数据不一致

当需要将byte[]转换成String字符串后再次将字符串转成byte[]时,发现用String的getBytes()的方法得到的byte[]跟原来的byte[]是不一样的。

看如下代码:

byte[] bytes = new byte[] { 50, 0, -1, 28, -24 };

String string = new String(bytes);

byte[] res = string.getBytes();

查看res的数据发现是 [50, 0, -17, -65, -67, 28] 并不是原来的数据。

而使用如下代码就可以得到原来的数据:

byte[] bytes = new byte[] { 50, 0, -1, 28, -24 };

String isoString = new String(bytes, "ISO-8859-1");

byte[] isores = isoString.getBytes("ISO-8859-1");

这是为什么呢?原因是第一种方法默认是用UTF-8编码来生成String的。UTF-8是可变长度的编码,原来的字节数组就被改变了。而ISO-8859-1通常叫做Latin-1,Latin-1包括了书写所有西方欧洲语言不可缺少的附加字符,其中 0~127的字符与ASCII码相同,它是单字节的编码方式,这样第二种方式生成的String里的字节数组就跟原来的字节数组一样。在new String使用其他编码如GBK,GB2312的话一样也会导致字节数组发生变化,因此要想获取String里单字节数组,就应该使用ISO-8859-1编码。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容