写入时复制(CopyOnWrite)思想
写入时复制(CopyOnWrite,简称COW)思想是计算机程序设计领域中的一种优化策略。其核心思想是,如果有多个调用者(Callers)同时要求相同的资源(如内存或者是磁盘上的数据存储),他们会共同获取相同的指针指向相同的资源,直到某个调用者视图修改资源内容时,系统才会真正复制一份专用副本(private copy)给该调用者,而其他调用者所见到的最初的资源仍然保持不变。这过程对其他的调用者都是透明的(transparently)。此做法主要的优点是如果调用者没有修改资源,就不会有副本(private copy)被创建,因此多个调用者只是读取操作时可以共享同一份资源。
CopyOnWriteArrayList
CopyOnWriteArrayList是Java中的并发容器类,同时也是符合写入时复制思想的CopyOnWrite容器。关于CopyOnWriteArrayList的介绍我就不过多赘述了,可以参考我这篇博客来了解-----《Java并发编程实战》学习笔记--并发容器类。
下面将通过CopyOnWriteArrayList的源码来了解写入时复制思想
CopyOnWriteArrayList中有一个ReentrantLock锁,这是一个可重入的锁,提供了类似于synchronized的功能和内存语义,但是ReentrantLock的功能性更为全面。由于本文重点是介绍CopyOnWrite思想,所以对于ReentrantLock就不过多介绍,只要知道它是用来保证线程安全性的即可。
下面这个两个方法是CopyOnWriteArrayList实现写入时复制的关键:
一个是获得当前容器数组的一个副本,另一个是将容器数组的引用指向一个修改之后的数组。
下面来看看使用了写入时复制的set方法:
public E set(int index, E element) {
final ReentrantLock lock = this.lock;
lock.lock();//获得锁
try {
Object[] elements = getArray();//得到目前容器数组的一个副本
E oldValue = get(elements, index);//获得index位置对应元素目前的值
if (oldValue != element) {
int len = elements.length;
//创建一个新的数组newElements,将elements复制过去
Object[] newElements = Arrays.copyOf(elements, len);
//将新数组中index位置的元素替换为element
newElements[index] = element;
//这一步是关键,作用是将容器中array的引用指向修改之后的数组,即newElements
setArray(newElements);
} else {
//index位置元素的值与element相等,故不对容器数组进行修改
setArray(elements);
}
return oldValue;
} finally {
lock.unlock();//解除锁定
}
}
我们可以看到,在set方法中,我们首先是获得了当前数组的一个拷贝获得一个新的数组,然后在这个新的数组上完成我们想要的操作。当操作完成之后,再把原有数组的引用指向新的数组。并且在此过程中,我们只拥有一个事实不可变对象,即容器中的array。这样一来就很巧妙地体现了CopyOnWrite思想。
其实这也是读写分离的一种体现。当线程在对线程进行读或者写的操作时,其实操作的是不同的容器。这么一来我们可以对容器进行并发的读,而不需要加锁。实际上就是这么做的:
那么问题来了
- 如果每次都要对原有的容器进行复制,岂不是很消耗内存?
- 还有,假如说一个线程正在对容器进行修改,另一个线程正在读取容器的内容,这其实是两个容器数组。那么读线程读到的不是旧数据吗?
没错,这正是CopyOnWrite容器t的不足:
- 存在内存占用的问题,因为每次对容器结构进行修改的时候都要对容器进行复制,这么一来我们就有了旧有对象和新入的对象,会占用两份内存。如果对象占用的内存较大,就会引发频繁的垃圾回收行为,降低性能;
- CopyOnWrite只能保证数据最终的一致性,不能保证数据的实时一致性。
所以对于CopyOnWrite容器来说,只适合在读操作远远多于写操作的场景下使用,比如说缓存。