生僻字一

----------yan字用五笔打出来的可以,或者用微软拼音输入法也行,搜狗输入法打出来的不行



问题1:登录从数据库读姓名:

䶮(通过查询数据库编码格式,以及字体编码集知,该字体编码:unicode \ue863 ,gbk \ufe9f),---见图1、2、3

此时java代码以utf-8形式返回,---见图4

独立环境测试(HP-UX),打印日志,显示为:王??(服务器日志字体问题);---见图5

debug模式下显示正常;---见图6

postman测试,本地console日志打印显示正常,postman返回字体显示有问题(怀疑postman字体或者解析有问题);---见图7

用curl命令,将独立请求在灰度独立执行(LINUX),灰度独立打印日志正常;---见图8、9

由此猜测是客户端问题。经客户端查验,更换字体后可解决乱码问题。---见图10


图1
图2
图3
图4


图5
图6
图7
图8

注意:去掉了keep-alive 和length,否则报超时

图9
图10

模拟测试:

问题2:客户端转账,

手工输入:王䶮(unicode \u4dae ,gbk \u3f),前台utf-8传入后端。----见图1

客户端运行时编码格式为GB18030,与短信平台交易以gbk形式传输,此时后端日志打印显示为:王?。----见图2

短信平台发送的短信显示为王?。----见图3

如果将1中数据库中的䶮( unicode \ue863 ,gbk \ufe9f)拷贝出来粘贴上操作,虽然客户端因字体问题显示乱码, ----见图4

但是发送短信平台可正常返回。 ----见图5


图1


图2
图3


图4


图5

模拟测试:

改动:经gb18030转换

后端utf-8接收,打印正常,发送报文时,由于直接从utf-8转gb18030,打印正常,再从18030转为byte,因后端服务器字体问题,打印为??

发送短信正常。

模拟测试1,经gb18030转换:



问题:

1、为什么经GB18030转换就可以了???------因为转一次GB18030后得到的GB18030编码是:FE9F,而FE9F正好对应有gbk编码。

是否所有汉字都可以先转GB18030,再转GBK?----不是,比如e863的,转一次GB18030后,得到的GB18030编码是:8336CF39,此时再转GBK是乱码:�6�9 。不过可以先做一次判断,如果该汉字经gbk转换后再转成String,跟原始汉字不equals,那么可以把该汉字先转一次GB18030,再用GBK转成String,测试结果见下图3。

2、Charset.defaultCharset()由什么决定?

3、运行时编码格式与代码里编码格式分别控制什么?


图1
图2
图3

https://blog.csdn.net/gywtzh0889/article/details/71083459  ---汉字unicode编码范围

前者在unicode是兼容性汉字区块( U+F900 to U+FAFF)里的,后者是统一汉字区块(U+4E00 to U+9FFF)里的

unicode编码中包含有477个兼容汉字,有的和一般的汉字长得一模一样!!!令人很伤感。参看这477个汉字:中文字符集 Unicode 编码范围-兼容汉字,共477字;比如“律”、“例”、“力”等字,都是一模一样。

所以,一个汉字还是只对应一个编码,只不过他们长得样子相同而已。


一、乱码的原因

gbk的中文编码是一个汉字用【2】个字节表示,例如汉字“内部”的gbk编码16进制的显示为c4 da b2 bf

utf-8的中文编码是一个汉字用【3】个字节表示,例如汉字“内部”的utf-8编码16进制的显示为e5 86 85 e9 83 a8

很显然,gbk是无法直接转换成utf-8,少字节变为多字节,谁知道缺少的字节是什么啊?!


GB 2312 标准共收录 6763 个汉字,其中一级汉字 3755 个,二级汉字 3008 个;同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的 682 个字符。

GBK编码范围:8140-FEFE,总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。---gbk中所有汉字:  https://www.qqxiuzi.cn/zh/hanzi-gbk-bianma.php  http://tools.jb51.net/table/gbk_table

http://ff.163.com/newflyff/gbk-list/

GB 18030 与 GB 2312-1980 和 GBK 兼容,共收录汉字70244个。与 UTF-8 相同,采用多字节编码,每个字可以由 1 个、2 个或 4 个字节组成。

Unicode编码:国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。---unicode中所有汉字 (所有汉字) https://blog.csdn.net/gywtzh0889/article/details/71083459


1、百度百科查询结果(查生僻字):https://baike.baidu.com/item/gb18030/3204518?fr=aladdin

2、汉字字符集编码查询结(查编码)果: https://www.qqxiuzi.cn/bianma/zifuji.php

3、csdn查询结果:https://blog.csdn.net/gywtzh0889/article/details/71083459

unicode编码


unicode编码-扩展A
unicode编码 -PUA(GBK)部件

4、https://www.qqxiuzi.cn/zh/hanzi-gbk-bianma.php

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,406评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,732评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,711评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,380评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,432评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,301评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,145评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,008评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,443评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,649评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,795评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,501评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,119评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,731评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,865评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,899评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,724评论 2 354

推荐阅读更多精彩内容