字符编码,ASCII码,Unicode,UTF-8

参考 http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
每个软件工程师都需要知道的编码和字符集

1、 字节和二进制位

1个字节 = 8个二进制位
二进制位 bit 有0,1两种状态
一个字节byte 有256种状态

一个字 = 2个字节
1 Byte = 8 Bits
1 KB = 1024 Bytes
1 MB = 1024 KB
1 GB = 1024 MB

2、 ASCII码

一个字节,8位bit,规定了128个字符的编码,包括32个不能打印的控制符号。首位为0,只占用后面的7位。

3、Unicode

所有符号的编码

4、UTF-8

是Unicode的实现方式之一。
UTF-8是一种变长的编码方式。


截图自阮一峰的网络日志
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容