ArrayList、Vector和Collections.synchronizedList()
ArrayList和Vector
前两天看了ArrayList
的源码,然后想起Vector
来,常常会将两者一起做对比。不过一想起Vector
马上要被判死刑了,就懒得去看Vector
的源码,于是网上查了一下两者的区别。
-
ArrayList
是线程不安全的,Vector
是线程安全的。 - 两者扩容方式不同。在底层数组容量不足时,
ArrayList
会将容量扩容为原来的1.5倍。而Vector
支持在创建的时候主动声明扩容时增加的容量的大小,通过Vector(int initialCapacity, int capacityIncrement)
构造函数实现。如果没有声明,或者capacityIncrement <= 0
,那么默认扩容为原来的2倍。见下列代码:
// Vector的扩容方法
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
capacityIncrement : oldCapacity);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
elementData = Arrays.copyOf(elementData, newCapacity);
}
Vector和Collections.synchronizedList
好吧,其实今天不是要讨论扩容方面的差异,主要是要看一下线程安全方面的。
虽然是ArrayList
是线程不安全的,但是通过Collections.synchronizedList()
方法可以将线程不安全的List
转成线程安全的List
。但是呢,在oracle的文档里,有这么一句话:
If you need synchronization, a Vector will be slightly faster than an ArrayList synchronized with Collections.synchronizedList.
Vector
比Collections.synchronizedList
快一点点?那这一点点到底是快在哪里呢?我们看一下SynchronizedList
的代码。
public static <T> List<T> synchronizedList(List<T> list) {
return (list instanceof RandomAccess ?
new SynchronizedRandomAccessList<>(list) :
new SynchronizedList<>(list));
}
static class SynchronizedList<E>
extends SynchronizedCollection<E>
implements List<E> {
private static final long serialVersionUID = -7754090372962971524L;
final List<E> list;
SynchronizedList(List<E> list) {
super(list);
this.list = list;
}
SynchronizedList(List<E> list, Object mutex) {
super(list, mutex);
this.list = list;
}
public boolean equals(Object o) {
if (this == o)
return true;
synchronized (mutex) {return list.equals(o);}
}
public int hashCode() {
synchronized (mutex) {return list.hashCode();}
}
...下面的代码大多类似,就省略了
}
从代码中可以看出,SynchronizedList<E>
类使用了委托(delegation),实质上存储还是使用了构造时传进来的list
,只是将list
作为底层存储,对它做了一层包装。正是因为多了一层封装,所以就会比直接操作数据的Vector
慢那么一点点。
从上面的代码我们也可以看出来,SynchronizedList
的同步,使用的是synchronized
代码块对mutex
对象加锁,这个mutex
对象还能够通过构造函数传进来,也就是说我们可以指定锁定的对象。而Vector
则使用了synchronized
方法,同步方法的作用范围是整个方法,所以没办法对同步进行细粒度的控制。而且同步方法加锁的是this
对象,没办法控制锁定的对象。这也是vector
和SynchronizedList
的一个区别。
线程安全并不"安全"
可能有些同学有在多线程环境下使用List
的需求,所以选择了Vector
或者Collections.SynchronizedList
,然后就以为可以再多线程环境下安全地操作List
了。但是这种想法可能会导致代码出现不可预料的错误,因为虽然Vector
(以Vector为例)实现了各个方法操作的线程安全,但是当多个方法之间进行协作时,却依然会出现race condition。
比如if(!list.contains(o)) list.add(o);
,还有Collections.swap(list, i, j);
,如果不在外部手工加锁的话,多线程环境下,这都会出现问题。尤其是对于List
经常会使用到的迭代。看一下下面这段代码:
public static void main(String[] args) throws InterruptedException {
Vector<Integer> vector = new Vector<>();
// 先存放1000个值让iterator有值可以遍历
for (int i = 0; i < 1000; i++) {
vector.add(i);
}
Thread iteratorThread = new Thread(new IteratorRunnable(vector));
iteratorThread.start();
// 主线程休眠5秒,让iteratorThread能够充分跑起来。这段时间是不会有问题的。
TimeUnit.SECONDS.sleep(5);
// 该线程启动之后,会结构化修改Vector,然后就会抛出ConcurrentModificationException异常
Thread modifyVectorThread = new Thread(new ModifyVectorRunnable(vector));
modifyVectorThread.start();
}
/**
* 这个Runnable会不断使用迭代器(for-each语句)遍历Vector
*/
private static class IteratorRunnable implements Runnable {
private Vector<Integer> vector;
public IteratorRunnable(Vector<Integer> vector) {
this.vector = vector;
}
@Override
public void run() {
while(true) {
for (Integer i : vector) {
}
}
}
}
/**
* 这个Runnable会不断添加新元素,也就是会结构化修改Vector
*/
private static class ModifyVectorRunnable implements Runnable {
private Vector<Integer> vector;
public ModifyVectorRunnable(Vector<Integer> vector) {
this.vector = vector;
}
@Override
public void run() {
while(true) {
vector.add(1);
}
}
}
IteratorRunnable
用来模拟迭代Vector
的线程,ModifyVectorRunnable
用来模拟结构化修改Vector
的线程。在main
函数中,iteratorThread
首先开始运行,不断迭代Vector
的值。主线程休眠5s,在这5s内,iteratorThread
是没有问题的。5s过后,modifyVectorThread
开始运行,该线程会向Vector
内添加元素,也就是结构化修改Vector
。
有些同学可能觉得这段代码不会有问题,因为Vector
是线程安全的,在多线程环境下理应正常运行。但是这个线程安全是有缺陷的,再迭代的情况下,我们需要的实际上是对整个迭代过程加锁,而不是对迭代器的hasNext
、next
等单独的方法加锁。这段代码会报ConcurrentModificationException
异常。如图:
解决方案很简单,对IteratorRunnable
的迭代过程加锁就可以了:
public void run() {
while(true) {
// 对迭代过程加锁
synchronized (vector) {
for (Integer i : vector) {
}
}
}
}