1. 背景介绍
1.1 RC4算法
在密码学中,RC4(来自Rivest Cipher 4的缩写)是一种流加密算法,密钥长度可变。它加解密使用相同的密钥,因此也属于对称加密算法。RC4是有线等效加密(WEP)中采用的加密算法,也曾经是TLS可采用的算法之一。
RC4由伪随机数生成器和异或运算组成。RC4的密钥长度可变,范围是[1,255]。RC4一个字节一个字节地加解密。给定一个密钥,伪随机数生成器接受密钥并产生一个S盒。S盒用来加密数据,而且在加密过程中S盒会变化。
由于异或运算的对合性,RC4加密解密使用同一套算法。
1.2 环境
- 操作系统:CentOS
- 编程语言:python 2.7.5
- python模块:标准库中的hashlib和base64;专门的密码学库Crypto
说明:Base64是一种用64个可打印字符来表示任意二进制数据的方法。这样加密出来的文件不会再是一堆乱码,方便存入文本文档中。hahslib中提供了常见的摘要算法,包括SHA,MD5等。
2. 伪代码
初始化长度为256的S盒。第一个for循环将0到255的互不重复的元素装入S盒。第二个for循环根据密钥打乱S盒。
for i from 0 to 255
S[i] := i
endfor
j := 0
for( i=0 ; i<256 ; i++)
j := (j + S[i] + key[i mod keylength]) % 256
swap values of S[i] and S[j]
endfor
下面i,j是两个指针。每收到一个字节,就进行while循环。通过一定的算法((a),(b))定位S盒中的一个元素,并与输入字节异或,得到k。循环中还改变了S盒((c))。如果输入的是明文,输出的就是密文;如果输入的是密文,输出的就是明文。
i := 0
j := 0
while GeneratingOutput:
i := (i + 1) mod 256 //a
j := (j + S[i]) mod 256 //b
swap values of S[i] and S[j] //c
k := inputByte ^ S[(S[i] + S[j]) % 256]
output K
endwhile
此算法保证每256次循环中S盒的每个元素至少被交换过一次。
3. Python实现
import hashlib, base64
def rc4(text, key = 'default-key', mode = "encode"):
key = hashlib.md5(key).hexdigest()#使用的不是原始密钥作为加密密钥,而是取长度固定为32的MD5摘要值作为密钥,从而方便处理
#python3中key需要先encode('utf-8')才能生成MD5
if mode == "decode":#加密得到的消息使用base64编码,则解密的时候需要先将base64编码去除
text = base64.b64decode(text)
result = ''
key_len = len(key)
#1. init S-box
box = list(range(256))#put 0-255 into S-box
j = 0
for i in range(256):#shuffle elements in S-box according to key
j = (j + box[i] + ord(key[i%key_len]))%256
box[i],box[j] = box[j],box[i]#swap elements
#2. make sure all elements in S-box swapped at least once
i = j = 0
for element in text:
i = (i+1)%256
j = (j+box[i])%256
box[i],box[j] = box[j],box[i]
k = chr(ord(element) ^ box[(box[i]+box[j])%256])
result += k
if mode == "encode":
result = base64.b64encode(result)
return result#python3在输出密文时需要result.encode('utf-8'),否则无法打印出来
4. 小结
这次在python2和python3的环境下都尝试了一下,python不同版本之间的编码问题真的让人头疼。上面的代码改成python3需要修改不少内容,我只列出了一部分。
最大的收获是了解了一些python写代码的小技巧,比如swap变量的时候,像上面只要一行语句就可以搞定了,比其他语言方便不少。range直接生成列表,不用再写繁琐的循环赋值语句了。
5. 其他
参考资料
完整代码
Github/zc12345