Base64编码方式在通信中的实际应用

加密就是为了安全通信而诞生的。没有通信，加密也没有太大存在的意义。

虽说Base64算不上一种加密，只是一种具有固定标准的编码方式，但如果适当的变换一下编码字典，不采用标准的编码方式，那对于不知道编码字典的第三方来说就是一种加密方式。

用途

在介绍Base64编码之前，我想先介绍下Base64的实际应用：

1）在前端中，当网页上有数目庞大的图片或其他资源时，浏览器会建立大量的http请求去获取资源。这样对服务器来说会产生大量的请求，浪费服务器性能。对于客户端来说，会多次请求资源，网络利用率不高，用户体验不好。所以，前端上有一个解决办法就是，对于大量的较小图片采用雪碧图（Sprite）,一次将一张较大图片加载回来，然后进行选择展示。但是这样会在js、css、html代码中增加很多附加代码，不利于后期操作与维护。于是，Base64的优势便显现出来，可以将图片进行Base64编码后嵌入到网页中，在展示时在将其进行Base64解码，显示在网页上。举一个具体的实例：在google的首页搜索框的搜索小图标就是在用这样的方式实现。

2）迅雷的种子：），大家一定懂得。为了不直接使下载链接暴露出来，迅雷（旋风等下载工具）都会对链接进行Base64编码。因为Base64编解码规则是公开的，所以你只需要对迅雷的种子进行Base64解码之后拿到下载链接，在别的地方下载，但是迅雷不会这样单纯的。一般来说迅雷会对编码表进行定制，在对编码方式进行一个修改，这样不知道规则的人就无法解密了。

3）在只能发送字符的通信方式进行文件传输。文件是由一系列二进制数据组成，而字符集的编码数量是小于byte的编码数量的（ASCII:0_127、BYTE:0255）。所以通过只能发字符的通信方式进行文件的传输看上去有些不可能，但是Base64恰恰解决的这个问题，Base64可以将byte映射到64个可见字符上。使用Base64将文件进行编码，形成一个字符串，在将字符串传给对方，对方收到后在进行解码，就可以还原出这个文件。

4）简单的加密通信。本文开始时，提到Base64使用非标准的字典进行编码时，对于第三方来说就是一种加密方式，对于第三方来说，想要破解，只能通过概率论来将编码字典得出。对于一些对加密效率要求高，而不要求太高的安全性的应用来说是一个比较好的选择。

Base64是什么

Base64是基于64个可见字符的编码方式，从Base64这个名字上可以得出。RCF文档中对标准Base64的编码字典规定为：
"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
‘=’最为填充字符
可以将任意二进制数映射到这64个字符中。

Base64的原理

举一个实际的例子来说明：

情况一

对二进制 0x12 、0x34、0x56，进行Base64编码。
1）00010010、00110100、01010110，每六个一组分为：000100、100011、010001、010110。
2）在计算机看来，上述新分组后的值为：00000100、00100011、00010001、000101110。相当于对每组数的高两位进行了零填充，也就是说我们分完组之后的数所能表示的最大的范围就是2^6 : 0 ~ 63，共64个数。

按照一一对应的方式，在编码字典中选取响应位置上的字符，分别是第12、33、17、46位，查编码字典为：M、h、R、u。
4）编码后为："MhRu"

最理想的情况是，待编码的字节数是3的倍数，编码后的字节数是4的倍数，而上述展示的就是最理想的情况。

情况二

下面展示除3余1的情况：
对二进制0x12 、0x34、0x56、0x78，进行Base64编码。
1）00010010、00110100、01010110、01111000，每六个一组分为：000100、100011、010001、010110、011110、000000

在计算机看来，上述新分组后的值为：00000100、00100011、00010001、000101110、00011110、00000000。
按照一一对应的方式，在编码字典中选取响应位置上的字符，分别是第12、33、17、46、0位，查编码字典为：M、h、R、u、e、A
为了满足编码后字节数为4的倍数，需要在编码后的字符后面添加'='填充符，M、h、R、u、e、A、=、=
编码后为："MhRueA=="

情况三

下面展示除3余2的情况：
对二进制0x12 、0x34、0x56、0x78，0x9a进行Base64编码。

00010010、00110100、01010110、01111000、10011010，每六个一组分为：000100、100011、010001、010110、011110、001001、101000
在计算机看来，上述新分组后的值为：00000100、00100011、00010001、000101110、00011110、00001001、00101000。
按照一一对应的方式，在编码字典中选取响应位置上的字符，分别是第12、33、17、46、30、9、40位，查编码字典为：M、h、R、u、e、J、o
4）为了满足编码后字节数为4的倍数，需要在编码后的字符后面添加'='填充符，M、h、R、u、e、J、o、=
编码后为："MhRueJo="

而解码就是编码的逆过程

总结

可以看出，编码前和编码后的空间占用比在文件很大时为3：4的关系，小文件的占用比例会略大。所以，Base64编码的缺点就是空间占用比增大，消耗了cpu的资源进行编码。由于Base64编码使用的都是可打印的普通字符，所以就能极大的减少在传输转换中的错误率。

代码实现


public class HFBase64 {
//编码表，可以自定义，这样只要双方都知道编码表，就变成一种加密方式了
    private static String encodingTable = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
    
    public HFBase64() {
        
    }
//编码方法
    public String enCode(byte[] datas) {
        if (datas == null) {
            return null;
        }
        String ciphertext = "";
        Integer byteIndex = 0;
        while (byteIndex < datas.length) {
            Integer index = 0;
            byte[] temByte = new byte[3];
            byte temp;
            while (index < 3 && byteIndex < datas.length)
                temByte[index++] = datas[byteIndex++];
            ciphertext += encodingTable.charAt((temByte[0] & 0xfc) >> 2);
            ciphertext += encodingTable.charAt(((temByte[0] & 0x03) << 4) | ((temByte[1] & 0xf0) >> 4));
            if (index > 1) {
                ciphertext += encodingTable.charAt(((temByte[1] & 0x0f) << 2) | (temByte[2] & 0xc0) >> 6);
            } else {
                ciphertext += '=';
            }
            
            if (index > 2) {
                ciphertext += encodingTable.charAt((temByte[2] & 0x3f));
            } else {
                ciphertext += '=';
            }
        }
        
        return ciphertext;
    }
//解码方法
    public byte[] deCode(String datas) {
        if (datas == null) {
            return null;
        }
        Integer len = (datas.length()) / 4 * 3;
        byte[] plainBytes = new byte[len];
        
        Integer charCount = 0;
        Integer index = 0;
        
        while (charCount < datas.length()) {
            
            plainBytes[index++] = (byte) ((this.convertByte(datas.charAt(charCount)) << 2) | (this.convertByte(datas.charAt(++charCount))) >> 4);
            if (datas.charAt(charCount + 1) == '=') {
//              plainBytes[--index] = (byte) (this.convertByte(datas.charAt(charCount)) >> 4);
                break;
            }
            plainBytes[index++] = (byte) ((this.convertByte(datas.charAt(charCount)) << 4) | (this.convertByte(datas.charAt(++charCount))) >> 2);
            if (datas.charAt(charCount + 1) == '=') {
//              plainBytes[--index] = (byte) (this.convertByte(datas.charAt(charCount)) >> 2);
                break;
            }
            plainBytes[index++] = (byte) ((this.convertByte(datas.charAt(charCount)) << 6) | (this.convertByte(datas.charAt(++charCount))));
            charCount++;
        }
        
        byte[] newBytes = new byte[index];
        for (int i = 0; i < index; i++) {
            newBytes[i] = plainBytes[i];
        }
        
        return newBytes;
    }
    
    private byte convertByte(char EncodeChar) {
        byte index = (byte) encodingTable.indexOf(EncodeChar);
        return index;
    }
}

Base64编码方式在通信中的实际应用