不同的编码与编码规则

推荐文章:
网页编码就是那点事
Unicode 和 UTF-8 有何区别?

编码

缩写 全称 含义
Ascii American Standard Code for Information Interchange 美国信息互换标准代码
DBCS Double Byte Charecter Set 双字节字符集
UCS Universal Multiple-Octet Coded Character Set 简称unicode
UTF UCS Transfer Format UTF-8是其一种实现
URL编码 URL encoding 也称为‘百分号编码’

个人理解:

  1. URL编码实际是将字符的ASCII表中的值转为16进制,如果遇到中文,默认根据GBK取该值的16进制。
    获取到16进制之后,再从右到左,取4位(不足4位直接处理),每2位做一位,前面加上%,编码成%XY格式。
    如中文字:“许”,对应的GBK16进制编码为:D0ED,如果通过urlencode编码转换的话就是:%D0%ED
    另外,urlencode遇到空格的话是转义成+

  2. base64urlencode都是一种编码规则,或者说是编码算法。而以上的unicode、ASCII、utf等都是对世界上现有的一些字符取了外号(一 一编码),就如同一本超大的计算机届的字典,一个字符对应一个外号(码、数值),这样不同国界的人,就可以通过这统一的规则进行无障碍交流了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容