Unicode为每个字符编号
UTF8规则以何种方式将Unicode编号存储到计算机中。
问题:例如「知」的码位是 30693,对应的二进制数为0111 0111 1110 0101,能不能把这个二进制码直接存储到计算机中?
回答:可以,这就是UTF16的编码规则,UTF16以二字节表示所有的Unicode码位,但是如果Unicode码位大于65536,二字节就表示不了了,这就是UTF16所存在的问题。
UTF8可以用1-4个字节表示Unicode码位,每个字节的前缀用来标示当前的码位对应的是几个字节,这样就可以实现字节变长。
Unicode
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 在当前这个时代(比如说公元2016年),如果你并不是在维护历史遗留的文本处理代码,没有在每个地方都使用Unicod...
- 定义: Unicode( 统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Uni...
- Unicode字符集的编码方式以及码点、码元 一、字符编码方式CEF的选择 1. 由于Unicode字符集非常大,...
- 人生就是一场漫长的旅行。 文静和小珂他们是一群正在创业的年轻人,每周伏案超过50个小时,对工作和生活都要充分管理,...