Unicode 编码

粗暴的理解:

Unicode其实就是世界上各个国家的每种文字都会在Unicode表上对应一个数字

var a = '我是中国人'

undefined

a.charCodeAt('2')

20013

a.charCodeAt('0')

25105

a.charCodeAt('3')

22269

英文字母也是一样。

所以这样,在进行数据传输的时候,我们可以显示对应的文字了。

不要理解为翻译,别以为通过她就可以把中文识别成对应的英文了。

要说翻译,他只是将每种文字翻译成了计算机可识别的形式。

而 UTF (-8/7...) 啊 GB(K/2312)他们是一些对于unicode的封装转换格式的编码解码集,用来在本区域传输数据的,比如在我国用GB2312,来编码进行传输的,你用其他编码方式进行解码,那不就崴了,所以要切换到对应的编码方式才可以正确显示出来。那utf-8呢是现在通用的编码方式,这样的好处,是我们都用统一的编码方式,那么解码也统一的方式就可以了。但是utf8的编码占用空间要比gbk(/gb2312)的大。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容