一、同步容器
1. 实现原理
同步容器可以简单地理解为通过 synchronized
来实现同步的容器,如果有多个线程调用同步容器的方法,它们将会串行执行。
2. 分类
同步容器将它们的状态封装起来,并对每一个公有方法进行同步。主要包括:
- Vector
- Stack
- HashTable
- Collections 工具类中部分方法生成,例如:
Collectinons.synchronizedList()
Collections.synchronizedSet()
Collections.synchronizedMap()
Collections.synchronizedSortedSet()
Collections.synchronizedSortedMap()
其中 Vector(同步的ArrayList)和 Stack(继承自Vector,先进后出)、HashTable(继承自 Dictionary,实现了 Map 接口)是比较老的容器,Thinking in Java 中明确指出,这些容器现在仍然存在于 JDK 中是为了向以前老版本的程序兼容,在新的程序中不应该在使用。Collections的方法时将非同步的容器包裹生成对应的同步容器。
同步容器在单线程的环境下能够保证线程安全,但是通过 synchronized 同步方法将访问操作串行化,导致并发环境下效率低下。而且同步容器在多线程环境下的复合操作(迭代、条件运算如没有则添加等)是非线程安全,需要客户端代码来实现加锁。
3. 代码示例
public static Object getLast(Vector list) {
int lastIndex = list.size() - 1;
return list.get(lastIndex);
}
public static void deleteLast(Vector list) {
int lastIndex = list.size() - 1;
list.remove(lastIndex);
}
上面的代码取最后一个元素或者删除最后一个元素,使用了同步容器 Vector。如果有两个线程 A 和 B 同时调用上面的两个方法,假设 list
的大小为 10,这里计算得到的 lastIndex
为 9,线程 B 首先执行了删除操作(多线程之间操作执行的不确定性导致),而后线程 A 调用了 list.get
方法,这时就会发生数组越界异常,导致问题的原因就是上面的复合操作不是原子操作,这里可以通过在方法内部额外的使用 list 对象锁来实现原子操作。
在多线程中使用同步容器,如果使用 Iterator 迭代容器或使用使用 for-each 遍历容器,在迭代过程中修改容器会抛出 ConcurrentModificationException
异常。想要避免出现 ConcurrentModificationException
,就必须在迭代过程持有容器的锁。但是若容器较大,则迭代的时间也会较长。那么需要访问该容器的其他线程将会长时间等待。从而会极大降低性能。
此外,隐式迭代的情况,如 toString
、hashCode
、equals
、containsAll
、removeAll
、retainAll
等方法都会隐式的 Iterator ,也可能抛出 ConcurrentModificationException
。
二、并发容器
1. 实现原理
同步容器并不能保证多线程安全,而并发容器是针对多个线程并发访问而设计的。在 JDK 1.5 中引入了concurrent包,其中提供了很多并发容器,极大的提升同步容器类的性能。
2. 分类
ConcurrentHashMap
- 对应的非并发容器:HashMap
- 目标:代替Hashtable、synchronizedMap,支持复合操作
- 原理:JDK 1.6 中采用一种更加细粒度的加锁机制 Segment 分段锁,JDK 1.8 中采用 CAS 无锁算法。
CopyOnWriteArrayList
- 对应的非并发容器:ArrayList
- 目标:代替Vector、synchronizedList
- 原理:利用高并发往往是读多写少的特性,读操作不加锁;写操作先复制一份新的集合,在新的集合上面修改,然后将新集合赋值给旧的引用,并通过 volatile 保证其可见性,当然写操作的锁是必不可少的了。
CopyOnWriteArraySet
- 对应的非并发容器:HashSet
- 目标:代替 synchronizedSet
- 原理:基于 CopyOnWriteArrayList 实现,其唯一的不同是在 add 时调用的是 CopyOnWriteArrayList 的 addIfAbsent 方法,其遍历当前 Object 数组,如 Object 数组中已有了当前元素,则直接返回;如果没有则放入 Object 数组的尾部,并返回。
ConcurrentSkipListMap
- 对应的非并发容器:TreeMap
- 目标:代替 synchronizedSortedMap(TreeMap)
- 原理:Skip List(跳表)是一种可以代替平衡树的数据结构,默认是按照 Key 值升序的。Skip List 让已排序的数据分布在多层链表中,以 0 - 1 随机数决定一个数据的向上攀升与否,通过 空间来换取时间 的一个算法。ConcurrentSkipListMap 提供了一种线程安全的并发访问的排序映射表。内部是 Skip List结构实现,在理论上能够在
O(log(n))
时间内完成查找、插入、删除操作。
ConcurrentSkipListSet
- 对应的非并发容器:TreeSet
- 目标:代替 synchronizedSortedSet
- 原理:内部基于 ConcurrentSkipListMap 实现
ConcurrentLinkedQueue
- 对应的非并发容器:Queue
- 原理:不会阻塞的队列,基于链表实现的 FIFO 队列(LinkedList 的并发版本)
LinkedBlockingQueue、ArrayBlockingQueue、PriorityBlockingQueue
- 对应的并发容器:Queue
- 特点:拓展了Queue,增加了可阻塞的插入和获取等操作
- 原理:通过 ReentrantLock 实现线程安全,通过 Condition 实现阻塞和唤醒
- LinkedBlockingQueue:基于链表实现的可阻塞的 FIFO 队列
- ArrayBlockingQueue:基于数组实现的可阻塞的 FIFO 队列
- PriorityBlockingQueue:按优先级排序的队列