jdk1.8 HashMap扩容原理解析

最近看面试题有聊到hashmap扩容,追本溯源,追到了1.8版本resize方法做的核心改进,找了资料一直也看不太懂,最后苦苦冥思总算弄懂了,在此做下笔记,也是做下分享,分享给同样云里雾里的码友。时间有限,所以研究的不全面,后期会陆续更新。

转载请注明出处!!!

在讲解源码之前还是要先做下铺垫。。。

1. &(与)运算

&运算是二进制位运算符中的一种

简单来说

------------------------------------------------------

1 & 1 = 1                1 & 0 = 0

0 & 1 = 0                0 & 0 = 0

------------------------------------------------------

两个操作数都为1,结果才为1,否则为0

说到这里,再说一下与运算很重要的一个技巧:取位

举个例子,我们有这样一个二进制    1010  0101

我们想取出看看第3位是0还是1,怎么做呢,我们这样

x = 1010 0101  &  100

为了方便理解,转换一下

------------------------------------------------------

1010  0101        &

0000  0100

------------------------------------------------------

我们看,下面只有第三位为1,其他全部为0,那么上面对应的位置肯定也为0

而第三位为1,那么结果就取决于上面对应第三位是0还是1了

如果是1  那么 1 & 1 = 1

如果是0 那么 0 & 0 = 0

如此我们计算上面的结果

x = 100 第三位为1

那如果是取第四位呢,同理

x = 1010 0101  &  1000            转换一下

------------------------------------------------------

1010  0101        &

0000  1000

------------------------------------------------------

结果显而易见

x = 0000 = 0


2.扩容思路

hashmap的数组长度,一定是2的次幂,其扩容就是长度直接扩2倍。

当散列表很大,节点很拥挤,链表会大量的出现,但是链表的查询速率很低,若节点数达到了加载因子的扩容条件,

——————————————————

注:虽然链表长度大于等于8会转化成红黑树,但是我们还是要尽量减少链表出现的概率,要使得节点更加分散。于是有了加载因子。0.75是很好的一个折中,因为扩容是很消耗资源的。

——————————————————

这时为了减少hash冲突得情况,减少链表出现的概率,我们得对hashmap进行扩容,并对node节点进行一次重新分布,使其分布得更均匀一些,怎么做呢。

我们看,假设这个hashmap的情况现在是这样

假设,它很挤了,需要扩容,那么扩容变成这样,再加一倍长度变成32


仅仅是这样还不行,否则没有最大限度利用扩容所做的牺牲(资源消耗),我们需要对node节点进行重新分布

怎么做呢,我们可以拿一部分节点,放到扩容出来的空间上,也就是

新下标 = 原下标 + 原数组长度

举个例子,假设我们把2和6拿过去,那就是变成这样


如此一来,原本的节点顺序没有发生太大的改动,新的空间得到了利用,节点分布也更均匀,链表出现的概率也更少,计算也更加简单

这就是jdk1.8的hashmap改动的巧妙之处。

这里还有一个问题,我们拿哪一部分,换句话说,怎么决定这个节点是不变还是移动到新的位置

为了降低hash冲突,我们得让它自己决定,我们要充分利用随机的特性,随机才会更加均匀

下面看源码实现

3.核心源码解析

我们都知道,hashmap的初始默认容量为16,换成二进制就是    1 0000    (16=2^5-1)

但是,数组下标是从0开始的,那么16-1=15,换成二进制就是    0 1111

那么扩容一次呢,长度会变成32,那么32-1=31 ,换成二进制就是    01 1111

就是在1111的基础上加了一位而已,我们知道,node节点是不变的,那么它的hash也不会变。

假设在经过扰动以后 hash = 1010  0101

对16-1进行与运算

——————————————————

1010  0101          &

0000  1111

------------------------------------------------

结果自然是0101 = 2^2 + 2^0 = 4 + 1 = 5

这个5便是原来的数组下标位置

我们带着第二节讲的扩容思路和第一节讲的取位技巧

在扩容后,长度32,31的二进制是0001 1111

对比原来的hash

———————————————————

1010  0101         

0001  1111

----------------------------------------------------

分析,我们便可以知道,hash是随机的,那么其第5位也是随机的

那我们只要把第5位取出来,看看,

如果为0,那么不动,你留在这里

如果为1,那你可以挪窝,你的    新下标 = 原下标 + 原数组长度

结合第一节,我们只需这样做

1010  0101 &  原数组长度  ==  0  ? 留下 :移动

转换一下

—————————————————

1010  0101

0001  0000    (16)

--------------------------------------------

结果为0,所以这个节点不移动。

那如果是1011 0101,那么这个节点就要移动

而这取决于扰动之后的结果,不由我们决定

这不就很好的尊重了随机吗

贴上源代码


标黄的地方就是整个的精髓所在,e是当前判断是否要移动的节点,oldCap就是原数组长度。


今天先到这里,如有疑问,可在下方评论,我后续更新补充。本文若有不妥之处,欢迎指正。谢谢观看。

最后,看完点个赞咯,想转载请注明出处哦!!!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容