文本编码UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK

编码是对全世界的文字的存储记录格式

ANSI

ANSI——美国国家标准学会
计算机早期出现,规定的字符串以1字节为单位,开始对字符进行编码工作。

美标

ASCII

ASCII是“美国信息交换标准编码”的英文字头缩写,可以称为美标。
计算机出现在美国,美国制定ASCII码,1字节。
0~127表示:大小写字母、控制符等。
128~255表示:没有规范,但被扩展为其他小语言字符、表格等等,成为“扩展字符集”。
后来各国家制定自己的ANSI,废除了该部分的字符。

国标

中国汉字需要上网,制定了自己使用的汉字编码方案

GB2312

GB2312是对ANSII的中文扩展,汉字2个字节,英文1个字节,
特点是:连续两个大于127的字符表示汉字。第一个字节(高字节)0xA10xF7,低字节0xA10xFE。收录了大约7000多简体汉字,包括数学符号、罗马希腊的字母、日本假名,还包括ANSII的文本字符2字节版,称为全角,原来127号以下的成为半角

GBK

GB2312里没有收录繁体字,香港和湾湾人民有意见,于是GBK编码出现,其实就是对GB2312的扩展。包含了GB2312的所有内容,新增20000个新汉字(包括繁体)和符号。
所有GBK兼容GBK2312。

GB18030

对GBK扩展,加入几千少数名族的文字。

BIG5

BIG5码是针对繁体汉字的汉字编码,在台湾、香港电脑系统中得到普遍应用。

Unicode

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 0x01 首先了解一下ASCII、GBK 和Unicode、UTF-8字符编码的那些事 ( 摘自网络流传甚广的一个...
    法加尔阅读 758评论 0 12
  • 以前的自己 每天早晨睁开眼睛,第一个想法,后悔前一天晚上睡晚了,然后,急急忙忙做早饭,吃完饭,赶出家门,赶地铁,在...
    盛于兰阅读 262评论 0 1
  • 本机允许其它用户ssh以root权限登录
    manbug阅读 250评论 0 0
  • 大一下半学期的时候,我已经和当时的新浪校园有了一定的关系,是我们学校的准校园大使,随着此后新浪微博改名叫微博之后,...
    影视相对论阅读 978评论 1 3
  • 昨晚是下了雨吗?满地湿迹。亲爱的你不要跑,小心滑倒,慢慢来就好。 我在人海这头,你在人山那头,各自忙碌。终是某个瞬...
    木无枝阅读 135评论 0 1

友情链接更多精彩内容