Base64编码

        Base64是一种基于64个可打印字符来表示二进制数据的表示方法。它已经成为网络上常见的传输8Bit字节代码的编码方式之一。

        我们都知道ASCII字符集由95个可打印字符(0x20-0x7E)和33个控制字符(0x00-0x1F,0x7F)组成。可打印字符可显示在输出设备上,例如荧屏或者打印纸上而控制字符没法打印出来,但是每个字符,都对应着一个特殊的控制功能的字符,因此这些字符简称功能字符或功能码 Function Code 。如用记事本打开exe、jpg、pdf这些文件时,我们都会看到一大堆乱码,因为二进制文件包含很多无法显示和打印的字符,所以如果要让记事本这样的文本处理软件能处理二进制数据,就需要一个二进制到字符串的转换方法。

Base64编码原理

        Base64协议选用了”A-Z、a-z、0-9、+、/” 64个可打印字符构成了Base64的索引表,如下


        数值代表字符的索引,这个是标准Base64协议规定的,不能更改。

    Base64的码表只有64个字符,如果要表达64个字符的话,使用6的bit即可完全表示(2的6次方为64)。

    因为Base64的编码只有6个bit即可表示,而正常的字符是使用8个bit表示, 8和6的最小公倍数是24,所以4个Base64字符可以表示3个标准的ascll字符。如果是字符串转换为Base64码,会先把对应的字符串转换为ascll码表对应的数字,然后再把数字转换为二进制,取8位二进制的前6位,剩下的2个二进制位和后面的二进制继续拼接,依次类推,最后再把6个二进制码转换为Base64对应的编码,如

字符串      a      b        c

ASCII     97      98       99

8bit   01100001 01100010 01100011

6bit   011000   010110   001001   100011

十进制      24      22        9        35

对应编码    Y       W        J        j

        3个ASCII字符刚好转换成对应的4个Base64字符。但是,当需要转换的字符数不是3的倍数的情况下该怎么办呢?Base64规定,当需要转换的字符不是3的倍数时,一律采用补0的方式凑足3的倍数,如:



        对于文本A,每6个Bit为一组,第一组转换后为字符“Q”,第二组末尾补4个0转换后为字符“Q”。剩下的使用“=”替代。即字符“A”通过Base64编码后为“QQ==”。这就是Base64的编码过程。

在python2中运行如下命令查看

>>> import base64

>>> a=base64.b64encode('A') 

>>> a

'QQ=='

>>> 

       b64encode函数的参数为byte类型,如果字符为unicode编码,需要先进行转码,如

>>> a=base64.b64encode(u'中文'.encode('utf-8'))

>>> a

'5Lit5paH'

>>> 

       解码命令为

>>> base64.b64decode(a)

'\xe4\xb8\xad\xe6\x96\x87'                   #“中文”的utf-8编码格式

>>> 

>>> print base64.b64decode(a)

中文

Base64编码的应用

       Base64编码的应用场景有

1、实现简单的数据加密,使用户一眼望去完全看不出真实数据内容,base64算法的复杂程度要小,效率要高相对较高。

很多下载类网站都提供“下载”的链接,其地址通常是加密的专用下载地址,如


其中旋风地址就是由原始地址在其前后分别添加AA和ZZ,再经过base64编码后得到的。如

>>> a=base64.b64encode('www.baidu.com/img/sslm1_logo.gif')   

>>> a

'd3d3LmJhaWR1LmNvbS9pbWcvc3NsbTFfbG9nby5naWY='

>>> 

2、编码的主要的作用不在于安全性,而在于让内容能在各个网关间无错的传输,这才是Base64编码的核心作用。在计算机中任何数据都是按ascii码存储的,而ascii码的128~255之间的值是不可见字符。而在网络上交换数据时,比如说从A地传到B地,往往要经过多个路由设备,由于不同的设备对字符的处理方式有一些不同,这样那些不可见字符就有可能被处理错误,这是不利于传输的。所以就先把数据先做一个Base64编码,统统变成可见字符,这样出错的可能性就大降低了。

3、应用在url中,url中&a=b是会作为参数名(a)和参数值(b)发送的,如果你发送的参数b中有&,那就会被浏览器认为是另一个参数名了,而这不是你的本意。所以,这时候你就可以把参数值b通过Base64进行编码,而你的服务器在获取到b后再解码b,就得到了原本带有&的b值了。



FYI,delete immediately if any infringements declared.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355