登录注册写文章

Java基础day21笔记：字符编码|“联通”|练习

楠楠喜欢泡枸杞

Java基础day21笔记：字符编码|“联通”|练习

2019/7/11 17:04 三刷留念

07-字符编码

既然讲到了字符编码，我们就讲一讲编码解码的问题。所谓编码解码就是为了对数据进行转换，把看得懂的变成看不懂的，或者把看不懂的变成看得懂的。

编码：字符串变成字节数组。

String-->byte[]; str.getBytes(charsetName);

解码：字节数组变成字符串。

byte[]-->String:new String(byte[],charsetName);

代码示例：

编码：

四个字节，对着呢~

指定用“GBK”：

会发生异常：

我们采取偷懒一点的处理方式，抛出异常：

这时运行结果就跟刚开始是一样的：

解码：

或者指定用“GBK”解码，结果也是一样的：

编码如果发生了错误，解码出来也是错的，没有办法补救，比如像下面这个：

因为ISO8859-1中没有中文，所以编码的时候它会找到和我们要编码的中文字符相似的符号，将那个字符的编码拿出来，所以后面再解码解的肯定也都是错的。

但是如果编码正常，解码出了问题，比如像这样：

这个时候还是有办法补救的：

用代码表示一下上面图示的过程：

其实这个过程在我们开发中就会遇见的，当我们在浏览器中输入网址点击提交之后，会提到服务端，服务端里面就有一个Tomcat服务器，这个服务器默认的解码方式是ISO8859-1。

如果这时我们输入了汉字，解码后就会是：

这时我们就会用到刚刚的方法，再给它编码、解码，最后得到正确的信息。

那可不可以不要这么麻烦，直接将服务器的码表改成GBK可以吗？

服务器中会有很多网站，比如新浪服务、搜狐服务，假设新浪服务用的编码表是GBK，就不会出现乱码，搜狐服务是UTF-8，就会乱码。所以指定GBK不可行，还是用ISO8859-1再编一次解一次比较好。

看一下浏览器，里面有一堆文字：

发现它默认的编码方式是GBK：

我们将它改成UTF-8试试：

发现乱码了：

我们可以看到网页源文件中指定的编码方式是GBK：

再回到代码中来，如果我们换成UTF-8再用这种方式就会出错：

并没有拿到原先的编码：

我们再把中文字符改成“哈哈”：

我们发现两次运行的结果很相似。

这是为什么呢？

在UTF-8码表中，也支持连续三个负数的文字。第一次解码的时候，先拿着前三/两个负数去编码表中查找，并没有找到符合这个编码的数据，它就去编码表中除了对应数据区以外的那部分：未知字符区域中查找，查完了之后返回一堆相似的字符“？？？”返回了。这时查出来的字已经变化了，不是原先的字了。

造成这个问题的原因是GBK和UTF-8都识别中文，所以这块一定要小心呢。

08-字符编码-联通

我们来演示一个问题，在记事本中存入“联通”：

保存，关闭记事本，再重新打开，发现乱码了：

我们另存为一下，发现编码变成了UTF-8,可是我们明明用的是默认的GBK呀：

我们来了解UTF-8的一个知识，它有一个标识头，根据这个标识头的数值，会决定它一次读几个字节：

用这个规律，我们读下面这串字节的过程就是这样的：

下面我们来拆解一下“联通”：

还不够，我们需要用二进制形式表示：

这样数字又太多了，其实有效位就后八位，于是我们再取后八位：

这时我们就发现，“联通”的编码前几位完全满足了UTF-8的规律，所以记事本读着读着发现，咦，这是UTF-8呀，于是就转成了UTF-8的编码表。“联通”的编码是非常特殊的存在呢。

那怎么解决这个问题呢？

就是在存入“联通”之前，前面一定要有其他汉字，这样就不会乱码啦：

09-练习

啊啊，时间有点紧张呢，为了节省时间，我就使用大面积截屏啦，手打太浪费时间了（委屈脸）。

做一个练习：

我们需要做：

思想：

代码：

Student类：

工具类：

到这里，学生信息都存入了集合并进行了排序。

下一步就是将集合信息写入文件，继续在这个工具类中写一个存入文件的方法：

好了，基本动作结束。

下面演示一下：

录入：

基本上没有什么大问题，就是后面总成绩有点小问题，我们发现stu.getSum()是一个整数，给后面加上+""，就可以强转成字符串了：

这下就好啦：

刚刚我们是按成绩从低到高排，现在我们想按成绩从高到低排，该怎么做呢？

原先的比较器是默认的写死的，我们不能对它进行修改，但是我们可以指定其它比较器，这里对工具类中的代码进行一些小的修改，将一个方法分割成两个：按默认比较器排和按指定比较器排，修改如下：

主函数中，我们只需要将原先的比较器进行逆转，就得到一个反向比较器：

OK，实现了按成绩从高到低排：

最后编辑于：2019.10.02 17:19:01

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

深入分析 Java 中的中文编码问题http://www.ibm.com/developerw...
编码问题一直困扰着开发人员，尤其在 Java 中更加明显，因为 Java 是跨平台语言，不同平台之间编码之间的切换...
x360阅读 7,216评论 1赞 20
字符、编码和Java中的编码
字符是用户可以读写的最小单位。计算机所能支持的字符组成的集合，就叫做字符集。字符集通常以二维表的形式存在。二维表的...
刘惜有阅读 12,548评论 2赞 14

Java基础进阶转换流、编码、解码、乱码
1、转换流(掌握) 我们学习字符流的时候知道字符流：它的底层是字节流和编码表。需求：在硬盘上新建一个文本文件D:\...
Villain丶Cc阅读 5,920评论 0赞 1
错过
或许这生我们就是有缘无分吧，或许当时你的表达太隐晦了，我没有明白你对我的爱，或许还有很多种原因我们都错过了，但我...
灵韵德瑞阅读 1,697评论 0赞 1
阿修罗
记录下每个夜晚的诳语窒息在每个夜晚悄悄来临为了美化现实，我编造连环梦境藏香的断裂是一半的惊醒 “生而为人，我...
念青尕玛措阅读 3,552评论 3赞 10

友情链接更多精彩内容

赞1赞

赞赏

手机看全文