python实现RC4加密算法

1. 背景介绍

1.1 RC4算法

密码学中,RC4(来自Rivest Cipher 4的缩写)是一种流加密算法,密钥长度可变。它加解密使用相同的密钥,因此也属于对称加密算法。RC4是有线等效加密(WEP)中采用的加密算法,也曾经是TLS可采用的算法之一。
RC4由伪随机数生成器和异或运算组成。RC4的密钥长度可变,范围是[1,255]。RC4一个字节一个字节地加解密。给定一个密钥,伪随机数生成器接受密钥并产生一个S盒。S盒用来加密数据,而且在加密过程中S盒会变化。
由于异或运算对合性,RC4加密解密使用同一套算法。

1.2 环境

  1. 操作系统:CentOS
  2. 编程语言:python 2.7.5
  3. python模块:标准库中的hashlib和base64;专门的密码学库Crypto

说明:Base64是一种用64个可打印字符来表示任意二进制数据的方法。这样加密出来的文件不会再是一堆乱码,方便存入文本文档中。hahslib中提供了常见的摘要算法,包括SHA,MD5等。

2. 伪代码

初始化长度为256的S盒。第一个for循环将0到255的互不重复的元素装入S盒。第二个for循环根据密钥打乱S盒。

 for i from 0 to 255
     S[i] := i
 endfor
 j := 0
 for( i=0 ; i<256 ; i++)
     j := (j + S[i] + key[i mod keylength]) % 256
     swap values of S[i] and S[j]
 endfor

下面i,j是两个指针。每收到一个字节,就进行while循环。通过一定的算法((a),(b))定位S盒中的一个元素,并与输入字节异或,得到k。循环中还改变了S盒((c))。如果输入的是明文,输出的就是密文;如果输入的是密文,输出的就是明文。

 i := 0
 j := 0
 while GeneratingOutput:
     i := (i + 1) mod 256   //a
     j := (j + S[i]) mod 256 //b
     swap values of S[i] and S[j]  //c
     k := inputByte ^ S[(S[i] + S[j]) % 256]
     output K
 endwhile

此算法保证每256次循环中S盒的每个元素至少被交换过一次。

3. Python实现

import hashlib, base64

def rc4(text, key = 'default-key', mode = "encode"):
    key = hashlib.md5(key).hexdigest()#使用的不是原始密钥作为加密密钥,而是取长度固定为32的MD5摘要值作为密钥,从而方便处理
    #python3中key需要先encode('utf-8')才能生成MD5
    if mode == "decode":#加密得到的消息使用base64编码,则解密的时候需要先将base64编码去除
        text = base64.b64decode(text)
    result = ''
    key_len = len(key)
    #1. init S-box
    box = list(range(256))#put 0-255 into S-box
    j = 0
    for i in range(256):#shuffle elements in S-box according to key
        j = (j + box[i] + ord(key[i%key_len]))%256
        box[i],box[j] = box[j],box[i]#swap elements
    #2. make sure all elements in S-box swapped at least once
    i = j = 0
    for element in text:
        i = (i+1)%256
        j = (j+box[i])%256
        box[i],box[j] = box[j],box[i]
        k = chr(ord(element) ^ box[(box[i]+box[j])%256])
        result += k
    if mode == "encode":
        result = base64.b64encode(result)
    return result#python3在输出密文时需要result.encode('utf-8'),否则无法打印出来

4. 小结

这次在python2和python3的环境下都尝试了一下,python不同版本之间的编码问题真的让人头疼。上面的代码改成python3需要修改不少内容,我只列出了一部分。
最大的收获是了解了一些python写代码的小技巧,比如swap变量的时候,像上面只要一行语句就可以搞定了,比其他语言方便不少。range直接生成列表,不用再写繁琐的循环赋值语句了。

5. 其他

参考资料

  1. 【维基百科】RC4
  2. RC4算法的Python实现详注

完整代码
Github/zc12345

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容