Java基础day21笔记:字符编码|“联通”|练习

2019/7/11 17:04     三刷留念


    07-字符编码

        既然讲到了字符编码,我们就讲一讲编码解码的问题。所谓编码解码就是为了对数据进行转换,把看得懂的变成看不懂的,或者把看不懂的变成看得懂的。

        编码:字符串变成字节数组。

        String-->byte[];  str.getBytes(charsetName);

        解码:字节数组变成字符串。

        byte[]-->String:new String(byte[],charsetName);

        代码示例:

        编码:

        四个字节,对着呢~

        指定用“GBK”:

        会发生异常:

        我们采取偷懒一点的处理方式,抛出异常:

        这时运行结果就跟刚开始是一样的:

        解码:

        或者指定用“GBK”解码,结果也是一样的:

        编码如果发生了错误,解码出来也是错的,没有办法补救,比如像下面这个:

        因为ISO8859-1中没有中文,所以编码的时候它会找到和我们要编码的中文字符相似的符号,将那个字符的编码拿出来,所以后面再解码解的肯定也都是错的。

        但是如果编码正常,解码出了问题,比如像这样:

        这个时候还是有办法补救的:

        用代码表示一下上面图示的过程:

        其实这个过程在我们开发中就会遇见的,当我们在浏览器中输入网址点击提交之后,会提到服务端,服务端里面就有一个Tomcat服务器,这个服务器默认的解码方式是ISO8859-1。

        如果这时我们输入了汉字,解码后就会是:

        这时我们就会用到刚刚的方法,再给它编码、解码,最后得到正确的信息。

        那可不可以不要这么麻烦,直接将服务器的码表改成GBK可以吗?

        服务器中会有很多网站,比如新浪服务、搜狐服务,假设新浪服务用的编码表是GBK,就不会出现乱码,搜狐服务是UTF-8,就会乱码。所以指定GBK不可行,还是用ISO8859-1再编一次解一次比较好。

        看一下浏览器,里面有一堆文字:

        发现它默认的编码方式是GBK:

        我们将它改成UTF-8试试:

        发现乱码了:

        我们可以看到网页源文件中指定的编码方式是GBK:

        再回到代码中来,如果我们换成UTF-8再用这种方式就会出错:

        并没有拿到原先的编码:

        我们再把中文字符改成“哈哈”:

        我们发现两次运行的结果很相似。

        这是为什么呢?

        在UTF-8码表中,也支持连续三个负数的文字。第一次解码的时候,先拿着前三/两个负数去编码表中查找,并没有找到符合这个编码的数据,它就去编码表中除了对应数据区以外的那部分:未知字符区域中查找,查完了之后返回一堆相似的字符“???”返回了。这时查出来的字已经变化了,不是原先的字了。

        造成这个问题的原因是GBK和UTF-8都识别中文,所以这块一定要小心呢。

    08-字符编码-联通

        我们来演示一个问题,在记事本中存入“联通”:

        保存,关闭记事本,再重新打开,发现乱码了:        

        我们另存为一下,发现编码变成了UTF-8,可是我们明明用的是默认的GBK呀:

        我们来了解UTF-8的一个知识,它有一个标识头,根据这个标识头的数值,会决定它一次读几个字节:

        用这个规律,我们读下面这串字节的过程就是这样的:

        下面我们来拆解一下“联通”:

        还不够,我们需要用二进制形式表示:

        这样数字又太多了,其实有效位就后八位,于是我们再取后八位:

        这时我们就发现,“联通”的编码前几位完全满足了UTF-8的规律,所以记事本读着读着发现,咦,这是UTF-8呀,于是就转成了UTF-8的编码表。“联通”的编码是非常特殊的存在呢。

        那怎么解决这个问题呢?

        就是在存入“联通”之前,前面一定要有其他汉字,这样就不会乱码啦:

    09-练习

        啊啊,时间有点紧张呢,为了节省时间,我就使用大面积截屏啦,手打太浪费时间了(委屈脸)。

        做一个练习:

       我们需要做:

        思想:

        代码:

        Student类:

        工具类:

        到这里,学生信息都存入了集合并进行了排序。

        下一步就是将集合信息写入文件,继续在这个工具类中写一个存入文件的方法:

        好了,基本动作结束。 

        下面演示一下:

        录入:

        基本上没有什么大问题,就是后面总成绩有点小问题,我们发现stu.getSum()是一个整数,给后面加上+"",就可以强转成字符串了:

        这下就好啦:

        刚刚我们是按成绩从低到高排,现在我们想按成绩从高到低排,该怎么做呢?

        原先的比较器是默认的写死的,我们不能对它进行修改,但是我们可以指定其它比较器,这里对工具类中的代码进行一些小的修改,将一个方法分割成两个:按默认比较器排和按指定比较器排,修改如下:

        主函数中,我们只需要将原先的比较器进行逆转,就得到一个反向比较器:

        OK,实现了按成绩从高到低排:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容

  • 编码问题一直困扰着开发人员,尤其在 Java 中更加明显,因为 Java 是跨平台语言,不同平台之间编码之间的切换...
    x360阅读 2,470评论 1 20
  • 字符是用户可以读写的最小单位。计算机所能支持的字符组成的集合,就叫做字符集。字符集通常以二维表的形式存在。二维表的...
    刘惜有阅读 8,095评论 2 14
  • 1、转换流(掌握) 我们学习字符流的时候知道字符流:它的底层是字节流和编码表。需求:在硬盘上新建一个文本文件D:\...
    Villain丶Cc阅读 1,888评论 0 1
  • 或许这生我们就是有缘无分吧,或许当时你的表达太隐晦了,我没有明白你对我的爱,或许还有很多种原因我们都错过了,但我...
    灵韵德瑞阅读 236评论 0 1
  • 记录下每个夜晚的诳语 窒息在每个夜晚悄悄来临 为了美化现实,我编造连环梦境 藏香的断裂是一半的惊醒 “生而为人,我...
    念青尕玛措阅读 554评论 3 10