字符编码

1 ASCII:American Standard Code for Information Interchange

  • 0~32:用作控制字符
  • 00000000-01111111:其他字符

2 GB2312标准

  • 00000000 00000000:大概能存储7000左右汉字

2.1 GBK:GB2312的拓展

  • 扩展大概多出20000左右字符,包含繁体字、假名、罗马字符

2.2 GB18030:包含很多少数名族字符


3 ISO:国际标准化组织

UCS:Universal Multi-Octet Coded Character Set
UCS俗称Unicode


4 UTF:Unicode Transfer Format

  • UTF有UTF8和UTF16,最常用的是UTF8,指的是每八位传输
  • UTF8表示一个字符用多少个字节不固定
  • 举例:
    • 如果一个字符只占一个字节,表示0xxxxxxx
    • 如果一个字符占两个字节,表示110xxxxx 10xxxxxx
    • 如果一个字符占三个字节,表示1110xxxx 10xxxxxx 10xxxxxx
    • 如果一个字符占四个字节,表示11111xxx 10xxxxxx 10xxxxxx 10xxxxxx

--

5 正确的写入写出方式

image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容