HashMap原理---put

hashmap底层使用数组+链表+红黑树实现

默认容量是16(必须是2的幂次)，最大容量是2的30次方，默认加载因子是0.75f

Q:为什么加载因子是0.75？

A：这段话的意思大概就是当加载因子取0.75时，泊松分布参数λ（λ表示单位时间内随机事件平均发生次数）能取0.5（不考虑方差），因此可以分别算出某个桶中装0,1,2,3,4,5,6,7,8个元素的概率，由图可知，某个桶中装8个元素的概率是0.00000006（几乎不可能），这也是为什么链表转红黑树的阈值设为8（其实7个节点的时候已经转换了）

因为红黑树结构比普通链表复杂，红黑树的大小是普通链表的两倍，当某个桶中元素总个数变小时（删除或者resize），就由红黑树转化为普通链表,理想情况下，红黑树结构很少使用（因为理想情况下一个桶中有8个元素概率太低了）

至于如何保证容量是2的幂次，是通过tableSizeFor()方法来实现的,所以，如果要指定容量的话，最好指定2的幂次方的容量

从hashmap的put()方法作为入口，逐步看hashmap原理

如果map中key已经存在，旧的value将会被覆盖，并可以返回旧的value

再来看putVal方法

1，第一个if表示如果table数组里面没有元素，那么就进行扩容（resize()）

这里说明了为什么要进行二倍扩容，因为容量是2的幂次方，所以当二倍扩容后，原来的元素不是在它之前的位置，就是在oldCap+之前的下标的位置

eg:

初始容量是16，下标为1的的位置有两个元素，他们的hash值分别为1和17，当数组二倍扩容后，容量变为32，hash值为1的元素仍然放在下标为1的位置，而hash值为17的元素将会放在下标为17的位置，（17=16+1，即当前的位置=旧数组的容量+之前的下标），为什么会出现这种结果呢？

由下标i=（length-1）&hash，

（16-1=15）的二进制是01111，（32-1=31）的二进制是11111，

1的二进制是0001，17的二进制是10001,

17&15=00001，17&31=10001

最开始17与1111（15）按位与最高位参与运算结果为0，而17与11111（31）按位与最高位参与运算结果为1，因此，第二次运算结果比第一次运算结果仅高位多了一个1，正好是旧数组的长度，就出现了这种性质。

扩容的方式也是按上述原理进行的，元素不是在新数组的之前的下标位置就是在（旧数组的容量+之前的下标）的位置，值得注意的是，源码并没有重新计算每个元素的新下标值，而是通过判断

e.hash & oldCap 是否为0，若为0，说明在之前的下标位置，若不为0(为1)，说明在（旧数组的容量+之前的下标）的位置。

eg:

oldCap=16(10)=10000(2)

1&16=0

17&16=1

Q:为什么newThr也要扩大两倍？

A：threshold定义为容量*加载因子，例如容量等于16，加载因子为0.75，那么oldThr为16*0.75=12；当容量扩大两倍后，newThr=16*2*0.75=oldThr*2

Q:什么时候要进行扩容？

A：下面这段代码在putVal方法中，当size大于threshold时，需要进行扩容；第一次初始化时需要扩容，所以当容量越大，空的位置就越多，例如加载因子固定为0.75，有25%的位置是空的

2.第二个if表示已经扩容过了，但是数组中指定下标 i 位置并没有元素，那么将i算出来之后直接插入，i=(n-1) & hash;

n为数组的容量（2的幂次方），hash的计算方式为key.hashcode^(key.hashcode<<<16);并不是网上说的key的hashcode，为什么要这样设计呢，我个人感觉是为了产生更加随机的哈希值，尽可能减少冲突，key.hashcode^(key.hashcode<<<16) 翻译过来就是key.hashcode与它的高16位进行按位异或，为什么要使用按位异或，而不使用按位与或者按位或呢，因为按位与的结果更偏向于0，而按位或的结果偏向于1，很难产生更加随机的哈希值。key.hashcode和它的高16位进行按位异或主要是为了让高16位也参与运算，尽可能减少哈希冲突。

Q:若不让高16位参与运算会怎么样?

A:由下标i=（n-1）& hash可知，i 的结果主要依赖于n，例如n=16，hash=11110011，当进行运算的时候结果主要取决于hash的低4位，hash的高4位并不参与运算（尽管它是1），因此需要将key.hashcode和它的高16位进行按位异或，从而产生更加随机的低16位（可能作者也感觉hashMap容量很难大于2的16次方吧），与n进行按位与的时候能产生更加随机的值，减少哈希冲突。

3.第三个else语句主要用于对数组中指定下标已经有元素的情况进行一些操作，包括尾插，转红黑树（7个节点的时候开始转换，间接说明链表中只有2至6个节点，因为只有1个节点的时候是在数组中）