UTF-8和GBK编码异同

UTF-8:Unicode TransformationFormat-8bit,用以解决国际上字符的一种编码,对中文使用8位(一个字节)、英文使用24位(三个字节)编码,对于英文字符较多的论坛则用UTF-8 节省空间。

UTF-8包含全世界所有国家需要用到的字符,通用性强。

UTF-8编码的文字可以在各国支持UTF-8字符集的浏览器上显示。如果是UTF-8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。


GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。

GBK的文字编码用双字节表示,即不论中、英文字符均使用双字节表示,为了区分中文,将其最高位都设定成1。

GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。

如果外国人访问你的GBK网页,需要下载中文语言包支持。


GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容