1、问:底层实现原理:
数组(初始容量为 16)+单向链表/红黑树。
2、问:HashMap 的特点:
1)HashMap 存储读取是无序的;
2)键和值都可以是 null,但是键位置只能是一个 null;
3)键位置是唯一的,底层的数据结构控制键;
4)JDK1.8 以前数据结构是:链表+数组;
5)JDK1.8 以后数据结构式:链表+数组+红黑树;
6)阈值(边界值)大于 8 并且数组长度大于 64,才将链表转为红黑树,为了提高效率。
3、问:说下HashMap的put操作?
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
①首先判断数组是否为空,如果数组为空则进行第一次扩容(resize)
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
②根据key计算hash值并与上数组的长度-1(int index = key.hashCode()&(length-1))得到键值对在数组中的索引。
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
……
③如果该位置为null,则直接插入
④如果该位置不为null,则判断key是否一样(hashCode和equals),如果一样则直接覆盖value
⑤如果key不一样,则判断该元素是否为[红黑树]的节点,如果是,则直接在[红黑树]中插入键值对
⑥如果不是[红黑树]的节点,则就是[链表],遍历这个[链表]执行插入操作,如果遍历过程中若发现key已存在,直接覆盖value即可。
如果[链表]的长度大于等于8且数组中元素数量大于等于阈值64,则将[链表]转化为[红黑树],(先在[链表]中插入再进行判断)
如果[链表]的长度大于等于8且数组中元素数量小于阈值64,则先对数组进行扩容,不转化为[红黑树]。
⑦插入成功后,判断数组中元素的个数是否大于阈值64(threshold),超过了就对数组进行扩容操作。
4、问:说下HashMap的 get 操作?
①计算key的hashCode的值,找到key在数组中的位置
②如果该位置为null,就直接返回null
③否则,根据equals()判断key与当前位置的值是否相等,如果相等就直接返回。
④如果不等,再判断当前元素是否为树节点,如果是树节点就按[红黑树]进行查找。
⑤否则,按照[链表]的方式进行查找。
5、问:HashMap的扩容机制?
(1). 首先生成一个新数组
(2). 遍历老数组每个位置中的链表或者红黑树
(3). 如果是链表直接计算每个元素的下标,然后将元素添加到新数组
(4). 如果是红黑树,则先遍历红黑树,计算出红黑树每个元素在新数组的下标位置
a. 统计每个数组下标位置的元素个数
b. 如果下标位置元素个数大于8,则生成一棵新的红黑树,并将树的根节点添加到新数组的对应下标位置。
c. 如果下标位置元素个数没有超过8,则生成一个链表,并将链表的头节点添加到新数组的对应位置
(5). 所有的元素转移完成之后,将新数组赋值给HashMap里的table属性
6、问:hashmap的链表是双向还是单向的?
答:单向链表。
7、问:什么是哈希碰撞,如何解决哈希碰撞?
答:只要两个元素的 key 经过计算后得到的 hash 值相同就会发生碰撞。JSDK8 以前采用链表来解决哈希碰撞。JSDK8 以后采用链表+红黑树来解决哈希碰撞。
hashCode 相同,通过 equals 比较内容是否相同并递归地进行如下的比较操作。
相同:将新的 value 覆盖旧的 value。
不相同:将新的键值对添加到哈希表中。
8、扩容是一个特别耗性能的操作,所以使用hashmap的时候,估算map的大小,初始化的时候给一个大致的数值,避免map进行频繁的扩容。
9、问:HashMap的初始容量为什么是16?
答:① 减少hash碰撞 (2n ,16=24)
② 需要在效率和内存使用上做一个权衡。这个值既不能太小,也不能太大。防止分配过小频繁扩容。分配过大会浪费资源。
10、问:HashMap的扩容因子为什么是0.75?
答:
① 当负载因子为1.0时,意味着只有当hashMap装满之后才会进行扩容,虽然空间利用率有大的提升,但是这就会导致大量的hash冲突,使得查询效率变低。
② 当负载因子为0.5或者更低的时候,hash冲突降低,查询效率提高,但是由于负载因子太低,导致原来只需要1M的空间存储信息,现在用了2M的空间。最终结果就是空间利用率太低。
总结:
负载因子是0.75的时候,这是时间和空间的权衡,空间利用率比较高,而且避免了相当多的Hash冲突,使得底层的[链表]或者是[红黑树]的高度也比较低,提升了空间效率。
11、问:HashMap扩容后会重新计算Hash值吗?
问:① JDK1.7,是需要的。
② JDK1.8,是不需要重新计算hash,只需要看看原来的hash值新增的那个bit是1还是0就可以了。
12、问:hashmap为啥不用完全二叉树。
答:红黑树(Red Black Tree) 是一种自平衡二叉查找树。
至于完全二叉树,它是一种特殊的二叉树,每个节点要么是一个叶节点,要么它有两个子节点。在 HashMap 中,使用完全二叉树不是因为它能提供更好的查找性能,而是因为它的实现和结构复杂度。HashMap 使用的散列表不需要满足完全二叉树的所有特性,并且在实际应用中,完全二叉树的插入和删除操作可能会涉及到大量的树节点的移动,这在 HashMap 这种频繁使用的数据结构中是不可接受的。
总结:HashMap 不使用完全二叉树作为底层数据结构主要是因为性能考虑,以及简化实现和减少不必要的复杂性。