何为Hash?
Hash就是把任意长度的输入通过散列算法变换成固定长度的输出。
如何获得Hash?
Hash是通过散列函数求出的。散列函数必须满足以下两个条件:
1.必须是一致的,同样的输入输出要一致;
2.应将不同的输入映射到不同的输出;
应用小场景
众所周知登陆网站一般都需要一个用户名和登陆密码,在用户第一次注册完成之后,每次登陆后台都需要验证用户输入的密码。因此后台需要记录住用户的相关信息:
Name | Password |
---|---|
小明 | 123456 |
James | 654321 |
Petter | 666666 |
但是如果这样保存起来的话,一旦被窃取,用户信息就暴露了。这时候就可以用到今天的主角Hash了。我们可以通过hash函数把密码映射一下,只保存映射值就可以了。因为从密码到映射值是唯一的,但是通过映射值推倒密码是比较困难的。
import hashlib
def passwordmd5(password):
md5 = hashlib.md5()
md5.update(password.encode())
return md5.hexdigest()
print(passwordmd5("123456"))
print(passwordmd5("654321"))
print(passwordmd5("666666"))
简单的利用hashlib库里面的md5实现了一下,经过映射之后,记录信息变成了以下:
Name | Password |
---|---|
小明 | e10adc3949ba59abbe56e057f20f883e |
James | c33367701511b4f6020ec61ded352059 |
Petter | f379eaf3c831b04de153469d1bec345e |
提高安全性
虽然以上方法已经把安全性提高了,但是如果用户设置的密码太简单,有些人通过简单测试,比如用一些常用的简单密码推倒hash值,然后再比获得密码。
111111 -> 96e79218965eb72c92a549dd5a330112
222222 -> e3ceb5881a0a1fdaad01296d7554868d
......
666666 -> f379eaf3c831b04de153469d1bec345e
为了再次提高安全性,可以对密码进行‘加盐’,即加入一些额外的字符来增加难度。这样用户即使设置了简单密码,加上额外字符后就不简单了。
import hashlib
def passwordmd5(password):
newpass = password + '_salt'
md5 = hashlib.md5()
md5.update(newpass.encode())
return md5.hexdigest()