字符编码集:ascii 、gbk 、Unicode、Utf-8

ascii

计算机只接受 “高”、“低”电压,所以使用二进制  1  和  0 分别代表高低电压

ascii  将 “字符”和“符号”转为二进制,在通过二进制转为电压让计算机识别

0-127 是 7 位ASCII 码的范围,是国际标准  0111 1111

byte

1 byte = 8 bit     就是8位二进制数    在不同语言中,字节范围不应,这主要取决于最高位是不是符号位

ascii  就是用一个字节,8位二进制表示一个字符或者符号

如 小写字母 a 的 ascii 编码是97,不同进制表示如下

二进制:01100001   (高四位 0110 低四位  0001)  

十进制:26 + 25 + 20 = 64 + 32 + 1 = 97


了解了ASCII,再来看看其他编码和byte的关系

ASCII 英文一个字节 

  (美国发明    上)

(中国也要用计算机,也就需要一套字符编码集来表示汉字字符     下)

gb2312,gbk 中文两个字节,英文一个字节 

在中文系统中ansi一般指gb2312或gbk 

GB2312、GBK都属于双字节字符集 (DBCS) 

(其他国家也需要计算机也就需要一套相应的字符编码来表示自己国家的字符)

Unicode 中文两个字节,英文两个字

(原来英文字符只占用一个字节,存放英文字符文档,unicode,会浪费一倍的空间)

Utf-8 中文三个字节,英文一个字节 


©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 字符编码 简介 起初再考虑写不写这篇文章,感觉这篇文章比较枯燥乏味,而且自己感觉也没理解的太透彻,就把理解的记录下...
    吴玉宏阅读 5,982评论 0 8
  • 这会儿我只听 不说不看 歌曲是茶杯里的香 诗句是远山的雪 你是我近处的远 我是你远处的近 你是从云雾笼罩的山中来 ...
    花香一路阅读 2,481评论 2 22
  • 今天学习了160分钟,复习了90分钟,抄写了4页A4纸,平均每页40分钟。 动词是英语句子中重要性仅次于主语的部分...
    HeJuN9阅读 4,264评论 1 1

友情链接更多精彩内容