字符编码

Unicode 是字符集;
UTF8,UTF16,GB18030等等是字符编码方式。

例如:
中文字符 : 哈
Unicode码 : 54c8
UTF8编码 : 十六进制 : 2e59388 , 二进制 : 11100101 10010011 10001000

UTF-8的编码规则很简单,只有二条:
1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的unicode码。因此对于英语字母,UTF-8编码和ASCII码是相同的。
2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。

参考来源:
http://alexiter.iteye.com/blog/1533109

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 字符是用户可以读写的最小单位。计算机所能支持的字符组成的集合,就叫做字符集。字符集通常以二维表的形式存在。二维表的...
    刘惜有阅读 8,211评论 2 14
  • 一、姓名存储和展现 1. 按学生总表编码存储 李洋薛鹏磊按照学生总表进行编码,并将编码进行存储或者发送 左边是客户...
    果芽软件阅读 5,192评论 0 0
  • 想来反应是相当迟钝了,前几日餐宴之上,尚未觉离别将近。至昨日室友离校,送之,方晓别离之殇,以致潸然,难以自...
    白兮宇兮阅读 1,250评论 0 1
  • 开篇扯淡 主要是介绍富文本段落的设置属性, 主要使用可变的段落设置 NSMutableParagraphStyle...
    Gui晨曦遇晓阅读 336评论 0 0