专题一 HashMap底层数据结构(一)

专题目录
一、HashMap jdk1.7和jdk1.8
二、HashMap线程安全问题
[三、HashMap和Hashtable、CurrentHashMap、HashSet]
[四、重写equals方法 --可引申到对象拷贝问题]
[五、红黑树 --可引申到B+树]
[六、总结对HashMap的感悟 ]
注:idea看源码必备快捷键:
ctrl+F12(查看类参数和方法)、ctrl+H(查看类的上下继承关系树)

1.7 HashMap

前言

在理解Hash和扩容流程之前,我们得先了解下HashMap的几个字段。从HashMap的默认构造函数源码可知,构造函数就是对下面几个字段进行初始化,源码如下:

 int threshold;             // 所能容纳的key-value对极限 
 final float loadFactor;    // 负载因子
 int modCount;  
 int size;

1.7之前还没Node节点只用了Entry

//hashmap的内部类
static class Entry<K,V> implements Map.Entry<K,V> 
        final K key;
        V value;
        Entry<K,V> next;//指向下一个节点
        int hash;

首先,Entry<K,V>[] table的初始化长度length(默认值是16),loadFactor为负载因子(默认值是0.75),threshold是HashMap所能容纳的最大数据量的Node(键值对)个数。threshold = length * Load factor。也就是说,在数组定义好长度之后,负载因子越大,所能容纳的键值对个数越多。

结合负载因子的定义公式可知,threshold就是在此Load factor和length(数组长度)对应下允许的最大元素数目,超过这个数目就重新resize(扩容),扩容后的HashMap容量是之前容量的两倍。默认的负载因子0.75是对空间和时间效率的一个平衡选择,建议大家不要修改,除非在时间和空间比较特殊的情况下,如果内存空间很多而又对时间效率要求很高,可以降低负载因子Load factor的值;相反,如果内存空间紧张而对时间效率要求不高,可以增加负载因子loadFactor的值,这个值可以大于1。

size这个字段其实很好理解,就是HashMap中实际存在的键值对数量。注意和table的长度length、容纳最大键值对数量threshold的区别。而modCount字段主要用来记录HashMap内部结构发生变化的次数,主要用于迭代的快速失败。强调一点,内部结构发生变化指的是结构发生变化,例如put新键值对,但是某个key对应的value值被覆盖不属于结构变化。

HashMap底层是哈希桶数组加链表实现的:


image.png

问题1:如何确定哈希桶数组索引位置

根据hash(key)来找到数组的下标,确定数组位置:

//链表节点的结构,1.7使用的是Entry,1.8使用的是Node
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;
...
//hash是key的hash值,table.length是数组的长度
int i = indexFor(hash, table.length);
...
static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
      //值得大家思考:为什么要逻辑与?--另外专题
        return h & (length-1);
    }

根据map.put源码可以看出,对key进行hash操作求出一个int值,就是需要存放在数组所在的位置;因为存在hash碰撞问题,不能保证一个数组位置只放一个值,可能有多个key的hash值一样,所以选择链表方式解决这种问题

问题2:put流程,如何扩容resize?

image.png

分析下put源码:

/**
     * Associates the specified value with the specified key in this map.
     * If the map previously contained a mapping for the key, the old
     * value is replaced.
     *
     * @param key key with which the specified value is to be associated
     * @param value value to be associated with the specified key
     * @return the previous value associated with <tt>key</tt>, or
     *         <tt>null</tt> if there was no mapping for <tt>key</tt>.
     *         (A <tt>null</tt> return can also indicate that the map
     *         previously associated <tt>null</tt> with <tt>key</tt>.)
     */
    public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        //遍历链表, table[i]:链表头节点
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
          //这里是判断key重复,这里判断有个细节问题,值得大家考量:为什么要先判断hash值?
          //结论:1、两个对象的hash值不相等,那么这两个对象一定不相等;
          //     2、hash值相等,这两个对象一定相等吗? 不一定!!!

            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                //返回被覆盖的value
                return oldValue;
            }
        }

        modCount++;
        //跟着走
        addEntry(hash, key, value, i);
        return null;
    }

进入addEntry方法:

/**
     * Adds a new entry with the specified key, value and hash code to
     * the specified bucket.  It is the responsibility of this
     * method to resize the table if appropriate.
     *
     * Subclass overrides this to alter the behavior of put method.
     */

    void addEntry(int hash, K key, V value, int bucketIndex) {
// 满足扩容的条件:1、size节点数>=table数组长度 
//2、当前数组上链表头节点不为null
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);
          //key==null 放在数组第一位上
            hash = (null != key) ? hash(key) : 0;
          //求扩容后新的数组位置index
            bucketIndex = indexFor(hash, table.length);
        }
       //跟着走
        createEntry(hash, key, value, bucketIndex);
    }

进入addEntry方法:

/**
   * Like addEntry except that this version is used when creating entries
   * as part of Map construction or "pseudo-construction" (cloning,
   * deserialization).  This version needn't worry about resizing the table.
   *
   * Subclass overrides this to alter the behavior of HashMap(Map),
   * clone, and readObject.
   */
// 这里可以看出是1.7使用的是头插法
void createEntry(int hash, K key, V value, int bucketIndex) {
      Entry<K,V> e = table[bucketIndex];
      table[bucketIndex] = new Entry<>(hash, key, value, e);
    //累计元素个数 , 联想到map.size()
      size++;
  }

回到上一步分析下resize:

void resize(int newCapacity) {
        HashMap.Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }

        HashMap.Entry[] newTable = new HashMap.Entry[newCapacity];
        //核心:将原数据迁移到新的数组上
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }

void transfer(HashMap.Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (HashMap.Entry<K,V> e : table) {
            while(null != e) {
                //先保存next节点数据
                // (因为迁移后 第一次next=null,迁移后的节点会倒置,而jdk8不会倒置)
                HashMap.Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                //使用头插法(头节点成为e的next节点)
                e.next = newTable[i];
                //e成为头节点
                newTable[i] = e;
                //指向next,继续迁移
                e = next;
            }
        }
    }

以上代码分析得出以下结论:
1、满足扩容的条件:size节点数>=table数组长度 ;当前数组上链表头节点不为null
2、扩容倍数2倍
3、1.7是先扩容后插入值,插入方式是头插法(此时如果选择尾插法,需要遍历链表,反而增加了复杂度,较低了插入的效率)

有疑问或有问题的请留言,希望可以与大家一起探讨源码学习进步!每天晚上都会更新我的技术点,下期补充1.8的区别,还有mysql索引底层原理...

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容