最近看面试题有聊到hashmap扩容,追本溯源,追到了1.8版本resize方法做的核心改进,找了资料一直也看不太懂,最后苦苦冥思总算弄懂了,在此做下笔记,也是做下分享,分享给同样云里雾里的码友。时间有限,所以研究的不全面,后期会陆续更新。
转载请注明出处!!!
在讲解源码之前还是要先做下铺垫。。。
1. &(与)运算
&运算是二进制位运算符中的一种
简单来说
------------------------------------------------------
1 & 1 = 1 1 & 0 = 0
0 & 1 = 0 0 & 0 = 0
------------------------------------------------------
两个操作数都为1,结果才为1,否则为0
说到这里,再说一下与运算很重要的一个技巧:取位
举个例子,我们有这样一个二进制 1010 0101
我们想取出看看第3位是0还是1,怎么做呢,我们这样
x = 1010 0101 & 100
为了方便理解,转换一下
------------------------------------------------------
1010 0101 &
0000 0100
------------------------------------------------------
我们看,下面只有第三位为1,其他全部为0,那么上面对应的位置肯定也为0
而第三位为1,那么结果就取决于上面对应第三位是0还是1了
如果是1 那么 1 & 1 = 1
如果是0 那么 0 & 0 = 0
如此我们计算上面的结果
x = 100 第三位为1
那如果是取第四位呢,同理
x = 1010 0101 & 1000 转换一下
------------------------------------------------------
1010 0101 &
0000 1000
------------------------------------------------------
结果显而易见
x = 0000 = 0
2.扩容思路
hashmap的数组长度,一定是2的次幂,其扩容就是长度直接扩2倍。
当散列表很大,节点很拥挤,链表会大量的出现,但是链表的查询速率很低,若节点数达到了加载因子的扩容条件,
——————————————————
注:虽然链表长度大于等于8会转化成红黑树,但是我们还是要尽量减少链表出现的概率,要使得节点更加分散。于是有了加载因子。0.75是很好的一个折中,因为扩容是很消耗资源的。
——————————————————
这时为了减少hash冲突得情况,减少链表出现的概率,我们得对hashmap进行扩容,并对node节点进行一次重新分布,使其分布得更均匀一些,怎么做呢。
我们看,假设这个hashmap的情况现在是这样
假设,它很挤了,需要扩容,那么扩容变成这样,再加一倍长度变成32
仅仅是这样还不行,否则没有最大限度利用扩容所做的牺牲(资源消耗),我们需要对node节点进行重新分布
怎么做呢,我们可以拿一部分节点,放到扩容出来的空间上,也就是
新下标 = 原下标 + 原数组长度
举个例子,假设我们把2和6拿过去,那就是变成这样
如此一来,原本的节点顺序没有发生太大的改动,新的空间得到了利用,节点分布也更均匀,链表出现的概率也更少,计算也更加简单
这就是jdk1.8的hashmap改动的巧妙之处。
这里还有一个问题,我们拿哪一部分,换句话说,怎么决定这个节点是不变还是移动到新的位置
为了降低hash冲突,我们得让它自己决定,我们要充分利用随机的特性,随机才会更加均匀
下面看源码实现
3.核心源码解析
我们都知道,hashmap的初始默认容量为16,换成二进制就是 1 0000 (16=2^5-1)
但是,数组下标是从0开始的,那么16-1=15,换成二进制就是 0 1111
那么扩容一次呢,长度会变成32,那么32-1=31 ,换成二进制就是 01 1111
就是在1111的基础上加了一位而已,我们知道,node节点是不变的,那么它的hash也不会变。
假设在经过扰动以后 hash = 1010 0101
对16-1进行与运算
——————————————————
1010 0101 &
0000 1111
------------------------------------------------
结果自然是0101 = 2^2 + 2^0 = 4 + 1 = 5
这个5便是原来的数组下标位置
我们带着第二节讲的扩容思路和第一节讲的取位技巧
在扩容后,长度32,31的二进制是0001 1111
对比原来的hash
———————————————————
1010 0101
0001 1111
----------------------------------------------------
分析,我们便可以知道,hash是随机的,那么其第5位也是随机的
那我们只要把第5位取出来,看看,
如果为0,那么不动,你留在这里
如果为1,那你可以挪窝,你的 新下标 = 原下标 + 原数组长度
结合第一节,我们只需这样做
1010 0101 & 原数组长度 == 0 ? 留下 :移动
转换一下
—————————————————
1010 0101
0001 0000 (16)
--------------------------------------------
结果为0,所以这个节点不移动。
那如果是1011 0101,那么这个节点就要移动
而这取决于扰动之后的结果,不由我们决定
这不就很好的尊重了随机吗
贴上源代码
标黄的地方就是整个的精髓所在,e是当前判断是否要移动的节点,oldCap就是原数组长度。
今天先到这里,如有疑问,可在下方评论,我后续更新补充。本文若有不妥之处,欢迎指正。谢谢观看。
最后,看完点个赞咯,想转载请注明出处哦!!!