一,使用场景
当需要一个多线程并发的环境下使用的Map的时候,需要一个高效运行正确的Map时,可以使用ConcurrentHashMap,平时单线程环境下,可以使用HashMap,但当其在多线程并发访问时会出错,因为其没有针对多线程并发的环境进行处理的逻辑,还有一个Map的子类是Hashtable,这个类可以在多线程环境下使用,下面是其中一些源码:
可以看到,使用频繁的put和get方法使用synchronized修饰来保证同步,锁对象是整个对象,同一时间只能有一个线程访问同一个对象,显然,这是比较低效的,例如,假如两个线程访问get方法,并没有修改内容,但也会令其中一个线程阻塞。
为了能更高效地使用Map,那么ConcurrentHashMap是比较优秀的工具
二,ConcurrentHashMap原理
ConcurrentHashMap 的锁分段技术可有效提升并发访效率,HashTable容器在竞争激烈的并发环境下表现出效率低下的原因是所有访问HashTable的线程都必须竞争同一把锁,假如容器里有多把锁,每一把锁用于锁容器其中部分数据,那么当多线程访问容器里不同数据段的数据时,线程问就不会存在锁竞争、从而可以有效提高并发访问效率,这就是ConcurentlasMap所使用的锁分段技术。首先将数据分成段一段地存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问。
三,ConcurrentHashMap的结构(Jdk 1.8)
ConcurrentHashMap 包含一个Node 数组:
Node 存储具体的键值对:
可以看到Node有一个next的成员变量,可知Node可以形成一个链表结构,整个ConcurrentHashMap存储结构大体如下:
从左往右是一个数组,每个数组又是一个链表。
首先看put方法:
前面提到的锁分段技术在这里可以体现出来,看重点 Node f;
由上面介绍可知,ConcurrentHashMap包含一个Node数组,ConcurrentHashMap进行put一个值时,首先根据key寻找适合的位置,代码是:
f =tabAt(tab, i = (n -1) & hash)
这是在ConcurrentHashMap的Node数组里面找出一个值,这个值是Node f,这个值同时也在它的链表的开头,这时,因为是并发操作,可以以Node f为锁,锁住这个链表,同时也锁住ConcurrentHashMap的Node数组的其中一个值,然后在这个链表里面进行插入操作。
当多个线程进行put操作且定位到不同的链表时,就可以并发操作,提高了效率。
在看get方法:
因为只是读取值,没有修改值,所以不需要同步,但是,读取值时可能另外一个线程正在更新值,为了保证当前线程能及时读取最新值,在Node类可以看到:
值val被volatile修饰,解决了这个更新问题
四,序列化
Map高度依赖key.hashCode()方法返回的值,而这个值与本地机器严重相关,序列化是不能直接镜像对象进行传输,可以看ConcurrentHashMap的序列化方式:
可以看到,就是把一个二维的Node数组一个个地写到流ObjectOutputStream中去,这时没有的数组和链表的结构了,