推荐文章:
网页编码就是那点事
Unicode 和 UTF-8 有何区别?
编码
| 缩写 | 全称 | 含义 |
|---|---|---|
| Ascii | American Standard Code for Information Interchange | 美国信息互换标准代码 |
| DBCS | Double Byte Charecter Set | 双字节字符集 |
| UCS | Universal Multiple-Octet Coded Character Set | 简称unicode |
| UTF | UCS Transfer Format | UTF-8是其一种实现 |
| URL编码 | URL encoding | 也称为‘百分号编码’ |
个人理解:
URL编码实际是将字符的
ASCII表中的值转为16进制,如果遇到中文,默认根据GBK取该值的16进制。
获取到16进制之后,再从右到左,取4位(不足4位直接处理),每2位做一位,前面加上%,编码成%XY格式。
如中文字:“许”,对应的GBK16进制编码为:D0ED,如果通过urlencode编码转换的话就是:%D0%ED。
另外,urlencode遇到空格的话是转义成+。base64和urlencode都是一种编码规则,或者说是编码算法。而以上的unicode、ASCII、utf等都是对世界上现有的一些字符取了外号(一 一编码),就如同一本超大的计算机届的字典,一个字符对应一个外号(码、数值),这样不同国界的人,就可以通过这统一的规则进行无障碍交流了。