前言#
在之前去新浪面试的时候,一开始问的都是Android问题,都没有什么压力,大公司不会去上来故意问一些蛋疼的问题,重点考察基础,然后再问一些思维有关的问题。
最后说想看看我的java基础,然后问了一个问题:你了解哈西算法吗?Java为什么要使用哈西算法?
很明显,我是栽在这个问题上了,如果说Java的Api的话,估计大部分的Android开发者都能说出一二,但是设计思想的话,我确实不太了解,所以就有了今天的主题。
这是一篇可能很枯燥的概念性博客,但是我真心的希望大家一起静下心来好好的看一看,聊一聊。
正文#
<h2>什么是哈西算法?</h2>
哈希算法,即散列函数,将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。一般用于快速查找和加密算法。
直接拿了百度百科的解释的一部分,剩下的就直接总结一下几点:
1、哈西算法得到的是二进制值。
2、哈希值在计算上具有唯一性(这一点特别注意,之后会再讲到)。
3、单向加密体制,只能加密,不能解密。
4、一般用于快速查找和加密算法(˙这一点是不是特别熟悉)。
ok,我们这里只是单独去了解哈西算法,所以不要这么早就去思考和Java语言相关的东西,否则误导你。
首先我们知道了他最常用的地方:快速查找和加密算法,那么我们回想一下在java中哪里用到了哈西算法呢?
1、hashCode:判断两个对象是否相同,一般要同时重写equals方法。
2、hashMap:通过键值对保存key和value。
3、MD5加密:MD5加密是常用的单向加密算法,例如ImageLoader,他就把图片的路径加密得到的字符串作为文件名,这样就大大避免了图片被盗。
<h2>哈西算法的优势</h2>
我们已经基本了解了哈西算法的概念,那么他有什么优点,才会有这么多人去使用它呢?
首先要提的是,他的不可逆性,这样对于被加密的对象来说是安全的,例如之前举例的图片缓存问题,对于盗图的人来说就是致命的打击,并且他的计算结果是是唯一的,也不用担心计算的结果相同导致的图片加载错乱的问题。
哈西算法最大的优势就是在一定范围内(前提),查找速度相当的快,比方说,我们刚开始学Java的时候,老师留的题目:
请找出数组(列表)中 对象 a的索引位置?
so easy,于是迅速的写下了解决方案:
// 保存最小值
int index;
for(object o:循环列表){
if(o.equals(a)){
max = number;
break;
}
}
// 得到结果
System.println("对象a的索引值是:" + index);
这是一个典型的线性查询,我们查询的最大次数,是这个数组或列表的长度,如果说这个长度特别大,几百万,几千万甚至更大(例如我们的电脑或者是手机内存),卧草草,那我不是要查到明年。
如果用哈西算法会怎么样呢? 首先我们先为对象a通过哈西算法得到一个标识,而这个标识会对应唯一的位置,当我们需要查找对象a的位置的时候,直接用标识去查找就可以了。
还是直接拿生活中的例子吧:
出去旅游,到了酒店去前台查房间号,我需要告诉前台我的身份证号:
1、如果前台使用的线性查找,那就一个一个房间比对吧,如果这个酒店够大,房间够多,我觉得我可以等到天亮。
2、如果对象使用的哈西算法查找,直接告诉你,我们把你的身份证号经过哈西算法计算,您对应的房间就是xxx。
是不是方便快捷,但是哈西算法也不是万能的:
1、首先要看哈西算法的复杂度是不是大大高于你的最大查找次数,造成查找效率低下。
2、大部分我们需要自己定义哈希表来保存一些东西,这样就很难确保计算的哈希值的唯一性,所以对于算法的要求还是很高的。
总结#
ok,我们就先来初步了解一下哈西算法到底是个什么东西,他有什么优点,我们能用来干什么,这一篇的目的就达到了,之后我们来看看Java是怎么使用哈西算法的。