概述
ArrayList可以理解为是一个可以动态扩容的数组,因为本身就是使用数组来实现的。
属性
/**
* 默认容量
*/
private static final int DEFAULT_CAPACITY = 10;
/**
* 初始空数组
*/
private static final Object[] EMPTY_ELEMENTDATA = {};
/**
* 默认初始容量下的空数组,这样我们知道在添加第一个元素的时候,应该扩容多少
*/
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
/**
* list实际保存数据的数组
*/
transient Object[] elementData; // non-private to simplify nested class access
/**
* list的容量大小
*/
private int size;
方法
ArrayList中的方法挺多,我们捡几个比较重要的使用较多的来学习以下。
add方法
add方法实现大致流程:
- 判断数组容量是否为空,如果是,比较默认容量与实际容量大小,取最大值;
- 判断实际所需容量如果大于数组容量,扩容;
- 保存数据,size加1;
源代码:
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
private void ensureCapacityInternal(int minCapacity) {
// 如果是空数组,取默认容量与所需容量的最大值为实际所需容量
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// 如果实际所需容量大于数组容量,扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
// 容量扩容为原来的1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
// 如果扩容后的容量还是小于实际所需容量,则将扩容后的容量设置为实际所需容量
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
// 如果扩容后的容量超过了系统预设的最大值:Integer.MAX_VALUE - 8,检测是否溢出
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// 使用Arrays的copyof方法将原数组数据拷贝到新的数组,并将新数组赋值给变量elementData
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
// 如果溢出,提示异常,如果没有溢出,实际所需容量是否超过系统预设的最大值,如果超过,返回Integer的最大值,如果没有超过,返回系统预设的最大值
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
remove方法
public E remove(int index) {
// 先判断下标是否越界
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
// 将后面整体往前
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
// 将数组最后一位置空,供GC调用
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
其实remove方法本身没什么好说的,主要说以下removeAll。removeAll是删除与另一个集合的交集。
removeAll方法的实现在于,先遍历elementData,将elementData与另一个集合c没有交集的数据,放置在elementData的下标的0到w段,然后再清除掉下标w到size-1之间的元素就行了(即设置为null)。
public boolean removeAll(Collection<?> c) {
// 参数非空校验
Objects.requireNonNull(c);
return batchRemove(c, false);
}
private boolean batchRemove(Collection<?> c, boolean complement) {
final Object[] elementData = this.elementData;
int r = 0, w = 0;
boolean modified = false;
try {
for (; r < size; r++)
if (c.contains(elementData[r]) == complement)
elementData[w++] = elementData[r];
} finally {
// 如果c.contains提示异常
if (r != size) {
System.arraycopy(elementData, r,
elementData, w,
size - r);
w += size - r;
}
// 如果有数据被删除
if (w != size) {
// clear to let GC do its work
for (int i = w; i < size; i++)
elementData[i] = null;
modCount += size - w;
size = w;
modified = true;
}
}
return modified;
}
TrimToSize方法
- 我们对数组扩容之后,有时候数组的容量会大于实际所需要的容量,这时候如果我们想将数组容量调整为实际所需要的容量,可以调用该方法。
- 比如内存紧张,或者我们可以确定不会再有元素添加进来时,也可以调用该方法来节省空间。
public void trimToSize() {
modCount++;
if (size < elementData.length) {
elementData = (size == 0)
? EMPTY_ELEMENTDATA
: Arrays.copyOf(elementData, size);
}
}
ensureCapacity方法
- 从add()与addAll()方法中可以看出,每当向数组中添加元素时,都要去检查添加元素后的个数是否会超出当前数组的长度,如果超出,数组将会进行扩容,以满足添加数据的需求。
- 在JDK8中,JDK提供了一个public的ensureCapacity方法让我们可以手动设置ArrayList的容量,以减少上面这种递增时调用再重新分配的数量;
public void ensureCapacity(int minCapacity) {
int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
// any size if not default element table
? 0
// larger than default for default empty table. It's already
// supposed to be at default size.
: DEFAULT_CAPACITY;
if (minCapacity > minExpand) {
ensureExplicitCapacity(minCapacity);
}
}
其他
由于ArrayList实现了RandomAccess, Cloneable, java.io.Serializable,所以支持随机读取,复制,序列化操作,对应一些方法:
/**
* 按下标读取
*/
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
/**
* 复制
*/
public Object clone() {
try {
ArrayList<?> v = (ArrayList<?>) super.clone();
v.elementData = Arrays.copyOf(elementData, size);
v.modCount = 0;
return v;
} catch (CloneNotSupportedException e) {
// this shouldn't happen, since we are Cloneable
throw new InternalError(e);
}
}
/**
* 序列化
*/
private void writeObject(java.io.ObjectOutputStream s)
throws java.io.IOException{
// Write out element count, and any hidden stuff
int expectedModCount = modCount;
s.defaultWriteObject();
// Write out size as capacity for behavioural compatibility with clone()
s.writeInt(size);
// Write out all elements in the proper order.
for (int i=0; i<size; i++) {
s.writeObject(elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}
private void readObject(java.io.ObjectInputStream s)
throws java.io.IOException, ClassNotFoundException {
elementData = EMPTY_ELEMENTDATA;
// Read in size, and any hidden stuff
s.defaultReadObject();
// Read in capacity
s.readInt(); // ignored
if (size > 0) {
// be like clone(), allocate array based upon size not capacity
ensureCapacityInternal(size);
Object[] a = elementData;
// Read in all elements in the proper order.
for (int i=0; i<size; i++) {
a[i] = s.readObject();
}
}
}
问题
- ArrayList线程不安全体现在什么地方?
ArrayList在添加元素的时候,可能分为两步:扩容,在该位置设置元素值。如果两个线程同时到这一步,各自扩容之后,各自在该位置设置元素值,这样同一个位置就被set了两次,导致数据的污染或者丢失;
- 如何是一个ArrayList线程安全?
可以借助Collections,List list = Collections.synchronizedList(new ArrayList());
- JDK 5在java.util.concurrent里引入了ConcurrentHashMap,在需要支持高并发的场景,我们可以使用它代替HashMap。但是为什么没有ArrayList的并发实现呢?难道在多线程场景下我们只有Vector这一种线程安全的数组实现可以选择么?为什么在java.util.concurrent 没有一个类可以代替Vector呢?
我认为在java.util.concurrent包中没有加入并发的ArrayList实现的主要原因是:很难去开发一个通用并且没有并发瓶颈的线程安全的List。
像ConcurrentHashMap这样的类的真正价值(The real point / value of classes)并不是它们保证了线程安全。而在于它们在保证线程安全的同时不存在并发瓶颈。举个例子,ConcurrentHashMap采用了锁分段技术和弱一致性的Map迭代器去规避并发瓶颈。
所以问题在于,像“Array List”这样的数据结构,你不知道如何去规避并发的瓶颈。拿contains() 这样一个操作来说,当你进行搜索的时候如何避免锁住整个list?
另一方面,Queue 和Deque (基于Linked List)有并发的实现是因为他们的接口相比List的接口有更多的限制,这些限制使得实现并发成为可能。
CopyOnWriteArrayList是一个有趣的例子,它规避了只读操作(如get/contains)并发的瓶颈,但是它为了做到这点,在修改操作中做了很多工作和修改可见性规则。 此外,修改操作还会锁住整个List,因此这也是一个并发瓶颈。所以从理论上来说,CopyOnWriteArrayList并不算是一个通用的并发List。
上面第三个问题转载自:
为什么java.util.concurrent 包里没有并发的ArrayList实现?
总结
ArrayList的优点是随机读取,缺点是插入数据时需要移动许多数据,而与之相对应的是LinkedList。我们将再下篇文章分析以一下。