1 ASCII:American Standard Code for Information Interchange
-
0~32
:用作控制字符 -
00000000-01111111
:其他字符
2 GB2312标准
-
00000000 00000000
:大概能存储7000左右汉字
2.1 GBK:GB2312的拓展
- 扩展大概多出20000左右字符,包含繁体字、假名、罗马字符
2.2 GB18030:包含很多少数名族字符
3 ISO:国际标准化组织
UCS:Universal Multi-Octet Coded Character Set
UCS俗称Unicode
4 UTF:Unicode Transfer Format
- UTF有UTF8和UTF16,最常用的是UTF8,指的是每八位传输
- UTF8表示一个字符用多少个字节不固定
- 举例:
- 如果一个字符只占一个字节,表示
0xxxxxxx
- 如果一个字符占两个字节,表示
110xxxxx 10xxxxxx
- 如果一个字符占三个字节,表示
1110xxxx 10xxxxxx 10xxxxxx
- 如果一个字符占四个字节,表示
11111xxx 10xxxxxx 10xxxxxx 10xxxxxx
- 如果一个字符只占一个字节,表示
--