ASC-II
0~127 英文字符、标点
计算机最开始的编码
ISO-8859-1,Latin-1
160~255 西欧字符
127后添加欧洲字符,英法德都在西欧
GB2312
0~65535 有7千多个中文字,其它调用周边地区字符
0-256-65535
GBK
20902个中文-双字节表示中文
Unicode 统一码,万国码(包含非洲原始部落字符)
一个文档显示多国文字
100万多个字符
常用表:双字节表示(包括英文)
例如:a 的Unicode表示为00 61 一个英文文档用Unicode表示,字节量、默认存储量、网络传输量翻倍。
生僻字:三字节、四字节表示
UTF-8 Unicode Transfer Format-UTF Unicode传输格式
Unicode字符如果用来保存或用来在网络上传输,应该转成Unicode传输格式
Unicode传输格式:UTF-8,UTF-16,UTF-16BE ,UTF-16LE,UTF-32,常用的是UTF-8
英文单字节
中文三字节
某些字符双字节
Java的char类型字符采用Unicode编码
'a' '\u0061' '中' '\u4e2d'