深入理解HashMap遍历元素的顺序

HashMap遍历元素的顺序。


一,HashMap元素的底层存储顺序


我们都知道HashMap是“无序”的,也就是说不能保证插入顺序。但是,HashMap其实也是有序的,一组相同的key-value对,无论他们插入的顺序是什么样的,遍历时,顺序都是一致的。

图片发自简书App

上面的代码,分别使用两种方式插入,也就是说插入顺序是不同的,但是遍历的结果是一样的。可以这样理解,只要你插入的是这19个元素,HashMap存储的时候,都是按照同一个顺序来存储的。

这一点其实也很容易理解,因为HashMap是使用hash算法来定位key的逻辑存储位置,只要你的key是一样的,逻辑存储位置也是一样的。

遍历结果如下:

11=11

12=12

13=13

14=14

15=15

16=16

17=17

18=18

19=19

0=0

1=1

2=2

3=3

4=4

5=5

6=6

7=7

8=8

9=9

10=10

为什么是这个顺序呢?本人很不理解。

如果说是根据key的hashcode来定位逻辑存储位置的话,关键key的hashcode也不支持这种说法啊。key的hashcode打印如下:

1568

1569

1570

1571

1572

1573

1574

1575

1576

49

50

51

52

53

54

55

56

57

1567

HashMap是通过hash算法把key映射到table数组的某个位置。以这个例子为例来说明,HashMap初始化容量指定为20,最终HashMap会把容量转化为32,那么这个HashMap的数组是一个长度为32的数组。

(为什么?稍后会说明)

OK,我们有一个长度为32的数组,接下来我们插入第一个元素,也就是key为0的一个字符串,这个key的hashcode值为48。那么这个key会被映射到数组的哪个位置呢?这个key对应数组的下标是多少呢?

这里有一个问题需要注意,长度为32的数组的下标必然是从0到31。然后这个数组的遍历顺序也是从0到31的顺序开始遍历。


查看源码我才发现,原来,数组的下标并不是key的hashcode值,而是key的hashcode值再经过按位与逻辑运算得到的。


先看一下源码,其他的代码我这里就不贴了,我只看最下面这行最关键的代码,如下图。


图片发自简书App

newTab[e.hash & (newCap - 1)] = e;

就是这行代码,这行代码就是把新增的节点Node放到数组中,放到数组中的哪个位置呢?

放到下标=e.hash & (newCap - 1)的位置!

好,那我就把e.hash & (newCap - 1)打印出来,看看到底是什么?

因为我们有20个元素,HashMap最终扩容以后的大小是32,也就是说:

newCap = 32

e. hash刚才说了,就是key的hashcode值,好,打印看看到底是什么鬼!

0-1-2-3-4-5-6-7-8-16-17-18-19-20-21-22-23-24-25-31

这就是结果!

这就是HashMap元素的存储顺序!

这就是HashMap元素的底层逻辑地址!

这!我的疑惑总算解开了!


下面再说一下2个关键问题:

1,指定的size大小是20,容量大小为什么变成了32。

2,HashMap为什么不直接用key的hashcode值来定位数组下标。


二,HashMap扩容的容量大小问题


HashMap初始化时,如果不指定,那么默认的容量大小为16。源代码中是这样的:

DEFAULT_INITIAL_CAPACITY = 1 << 4

但是我指定了容量为20,为什么就变成了32呢?


想搞清楚这个问题,必须清楚HashMap容量大小的计算逻辑。


源码如下:

图片发自简书App

这个方法是一系列的逻辑位运算。反正我现在是看不懂了,不过没关系,我把代码拿过来跑一下看看结果。

当入参是16的时候,返回16。

当入参是20的时候,返回是32。

原来如此啊,HashMap的容量大小必须是2的N次方。


结论:HashMap的容量必须是2的N次方,如果你指定了一个非2的N次方的整数S,那么HashMap在内部会把它转化为大于S的2的N次方的整数。

当然,这个整数是大于S的2的N次方的整数中最小的那一个。


三,HashMap为什么不直接用key的hashcode值来定位数组下标。


原因其实很简单,因为本例中HashMap的数组是一个长度为32的数组,下标从0到31。

key的hashcode值超过了31,就不行了。

所以,java的开发者做了一个映射,把key的hashcode值映射到0到31的区间范围。如何映射的呢?就是上面提到的:

e.hash & (newCap - 1)

把key的hashcode值与31做位与操作。

java的位与操作,忘记的可以自行脑补,我这里不在赘述,网上有很多讲解。我这里说一下java设计者的实现思路,为什么要这样实现。

为什么呢?因为HashMap是可以扩容的,newCap这个变量是动态的,本例中是32,但是如果是64呢,如果是256呢?

这时我就把这个newCap当做一个变量,接受用户输入。这样就成功把key的hashcode值映射到了指定范围的区间内:

【0到newCap减1】

这里的位与操作是关键,我们想把一些随机的整数映射到指定范围的区间时,可以考虑使用位与操作。这是计算机逻辑运算的特性,java的开发者们很好的利用了这一特性。


好了,今天的分享到此结束。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Java集合类可用于存储数量不等的对象,并可以实现常用的数据结构如栈,队列等,Java集合还可以用于保存具有映射关...
    小徐andorid阅读 1,965评论 0 13
  • 在编程中,常常需要集中存放多个数据。集合类主要负责保存、盛装其他数据,因此集合类也被称为容器类。所有的集合类都位于...
    一一一二二三阅读 415评论 0 1
  • 集合类框架的介绍: ![Java 集合类框架](https://upload-images.jianshu.io/...
    LynnGuo阅读 762评论 0 1
  • 简介 1.所有的集合类都位于java.util包下,Java的结合主要由两个接口类派生出来,分别是Collecti...
    yunqing_71阅读 2,551评论 0 2
  • 原文地址 Java集合 Java集合框架:是一种工具类,就像是一个容器可以存储任意数量的具有共同属性的对象。 Ja...
    gyl_coder阅读 995评论 0 8