- Unicode的UTF8表示法
中文编码
GB2312,包含7445个字,其中6763个汉字,1980发布。
GBK兼容GB2312,包含21886个字,1995发布
GB18030,两个版本,27533/70244个汉字,2000/2005发布
Unicode编码
- 目的:为了包含所有语言的编码
- 使用4个字节来表示
- 包含多个平面
UTF-8
- 全称:8-bit Unicode Transformation Format
- 能表示Unicode所有字符
- 变长字符,不同语言的unicode码转化到UTF-8后的字节数可能不同。
字符编码笔记:ASCII,Unicode和UTF-8