《Java并发编程实战》学习笔记--同步容器类
前面介绍了同步容器类,下面来说说并发容器类。
- 同步容器类:将所有对容器的访问都串行化以实现它们的线程安全性。但是这样严重降低了并发性,当多个线程竞争容器的锁时吞吐量将降低;
- 并发容器类:并发容器是针对多个线程并发访问设计的。通过并发容器来代替同步容器,可以极大地提高伸缩性并降低风险。
并发容器背景介绍
Java提供了多种并发容器来改进同步容器的性能:
- ConcurrentHashMap用来替代同步且基于散列的Map;
- CopyOnWriteArrayList用于在遍历操作为主要支持的情况下代替同步的List。
- 在ConcurrentMap接口中包含了对一些常见复合操作的支持,例如“若没有则添加”、替换以及有条件删除等。
在Java中,有这样两种容器类型:Queue和BlockQueue。
Queue用来临时保存一组等待处理的元素。它提供了以下几种实现:
- ConcurrentLinkedQueue,这是一个传统的先进先出的队列;
- PriorityQueue,这是一个(非并发的)优先队列。
Queue上的操作不会阻塞,如果队列为空,那么获取元素的操作就会返回空值。
BlockingQueue扩展了Queue,增加了可阻塞的插入和获取操作。如果队列为空,那么获取元素的操作将一直阻塞,直到队列中出现了一个可用的元素。如果队列已满(对于有界队列来说),那么插入元素的操作将一直阻塞,直到队列中出现可用的空间。
ConcurrentHashMap
同步容器类在执行每个操作期间都拥有一个锁。在某些操作中,例如HashMap.get或List.contains,可能包含大量的工作:当遍历散列桶或者是链表来查找特定的对象时,必须在许多元素上调用equals(而equals还包含一定的计算量)。在基于散列的容器中,如果hashCode不能均匀地分布散列值,那么容器中的元素就不会均匀地分布在整个容器中。某些情况下,糟糕的散列函数还可能把一个散列表变成线性链表。这样一来,当遍历很长的链表并且在某些或者是全部元素上调用equals方法时,会花费很长的时间。而其他线程在这段时间内都不能访问该容器。
同HashMap一样,ConcurrentHashMap也是一个基于散列的Map。但它采用了一种完全不同的加锁策略来提供更高的并发性和伸缩性。ConcurrentHashMap不是把每个方法都在同一个锁上同步并使得每次只有一个线程访问容器。而是使用一种力度更细的加锁机制来实现更大程度的共享----这种加锁机制称为分段锁(Lock Striping)。在此机制中,任意数量的读取线程可以并发地访问Map,执行读取操作的线程和执行写入操作的线程可以在并发环境下将实现更高的吞吐量,而在单线程环境中只损失了非常小的性能。
ConcurrentHashMap与其他并发容器一起增强了同步容器类:它们提供的迭代器不会抛出ConcurrentModificationException,因此不需要再迭代过程中对容器加锁。ConcurrentHashMap返回的迭代器具有弱一致性(Weakly Consistent),而并非“及时失败”。弱一致性的容器可以容忍并发的修改,当创建迭代器时会遍历已有的元素,并可以但不保证在迭代器被构造后将修改操作反映给容器。
还有要注意的就是,size以及isEmpty方法在并发环境下的用处很小,因为它们的返回值具有诸多不确定性。因此这些操作的需求被弱化的,换取对其他更重要操作的性能优化,包括get、put、containsKey和remove等。
在大多数情况下,用ConcurrentHashMap来代替同步Map可以进一步提高代码的可伸缩性。
只有当应用程序需要加锁Map以进行独占访问时,才应该放弃使用ConcurrentHashMap。
额外的原子Map操作
由于ConcurrentHashMap不能被加锁来执行独占访问,因此我们无法使用客户端加锁来创建新的原子操作。但是一些常用的符合操作,例如“Put-If-Absent”、“Remove-If-Equal”、“Replace-If-Equal”等,都已经实现为原子操作并在ConcurrentMap接口(ConcurentHashMap类就实现了此接口)中声明,如果需要在现有的同步Map中添加这样的功能,就可以考虑使用ConcurrentMap了。
CopyOnWriteArrayList
CopyOnWriteArrayList用于替代同步List,在某些情况下它提供了更好的并发性能,并且在迭代期间不需要对容器进行加锁或者是复制。(类似地,CopyOnWriteArraySet的作用是替代同步Set)
“写入时复制(Copy-On-Write)”容器的线程安全性在于只要正确地发布一个事实不可变的对象,那么在访问该对象的时候就不再需要进一步的同步。在每次修改的时候,都会创建并重新发布一个新的容器副本,从而实现可变性。
“写入时复制”容器的迭代器保留一个指向底层基础数组的引用,这个数组当前位于迭代器的起始位置,由于它不会被修改,因此在对其进行同步时只需确保数组内容的可见性。因此,多个线程可以同时对此容器进行迭代,而不会彼此干扰或者与修改容器的线程相互干扰。“写入时复制”容器返回的迭代器不会抛出ConcurrentModificationException,并且返回的元素与迭代器创建时的元素一致,而不用考虑之后修改操作所带来的影响。
显然每当修改容器时都会复制底层数组,这需要一定的开销,特别是当容器的规模较大时。仅当迭代操作远远多于修改操作时,才应该使用“写入时复制”容器。这个准则很好地描述了时间通知系统:在分发通知时需要迭代已注册监听器链表,并调用每一个监听器,在大多数情况下,注册和注销事件监听器的操作远远少于接收事件通知的操作。