Unicode

Unicode为每个字符编号
UTF8规则以何种方式将Unicode编号存储到计算机中。
问题:例如「知」的码位是 30693,对应的二进制数为0111 0111 1110 0101,能不能把这个二进制码直接存储到计算机中?
回答:可以,这就是UTF16的编码规则,UTF16以二字节表示所有的Unicode码位,但是如果Unicode码位大于65536,二字节就表示不了了,这就是UTF16所存在的问题。
UTF8可以用1-4个字节表示Unicode码位,每个字节的前缀用来标示当前的码位对应的是几个字节,这样就可以实现字节变长。

Unicode(UTF-8, UTF-16)令人混淆的概念

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容