一、List集合
List集合是Collection子类。ArrayList、LinkedList、Vector分别是对List的实现。类结构图如下:
二、ArrayList、LinkedList、Vector的区别
ArrayList随机查询效率高,但删除、插入的效率低,是线程不安全的。
LinkedList随机查询的小路低,但删除、插入等写操作的效率高,线程同样是不安全的。
vector跟ArrayList基本一致,但线程是安全的。
但是以上的结论是从哪得来的呢?我们来详细看一下。
1、ArrayList
从上图我们可以看出,ArrayList底层的数据结构其实是数组结构。我们从ArrayList中使用get()方法获取值的时候,是通过数组下标来获取值的,所以ArrayList的随机查询效率较高,时间复杂度是O(1)。那在删除等操作的时候,删除完之后需要将后面的值整体进行前移,所以整体的效率不高,时间复杂度是O(n)。如图,将下标为2,值为5的数组元素删除之后,会将后续的值整体前移到前一个值的位置。
从上面我们可以看出ArrayList随机查询效率高,删除等操作效率低的原因。接下来我们来看看ArrayList线程不安全的情况。
ArrayList线程不安全问题
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
我们来看一下ArrayList的add方法源码,上面的代码主要做了两步操作,判断当前size+1是否超过了数组长度和将当前数据放到数组的当前size+1的下标中。
这里就体现出线程不安全的情况了,在ensureCapacityInternal(size + 1);这步操作时,如果是多线程的情况下,如果数组大小为10,此时的size为9,那么线程A首先判断size+1不会导致数组下标越界,然后挂起。随后线程B也走到这一步发现不需要扩容,这时候执行完赋值方法后,size大小为10了。此时线程A开始赋值,就会导致数组下标越界异常。
另外一种情况就是在elementData[size++] = e;这步操作的时候。我们为了好理解可以把这行代码拆分为如下代码:
elementData[size] = e;
size++;
我们发现这行代码其实并不是一个原子性的操作。它是首先将值新增到当前size位置,然后进行size++。这个时候就会出现值被覆盖的问题。首先线程A将值新增到当前size后,在还未进行size++的时候,线程B也将值新增到了当前的size,此时就会造成线程A新增的值被覆盖。
既然ArrayList会导致线程不安全的问题,那么我们要怎么解决这个问题呢?可以对ArrayList加锁,也可以直接使用synchronizedList 或者CopyOnWriteArrayList。
关于synchronizedList 和CopyOnWriteArrayList详见:https://www.jianshu.com/p/6455a4e66e14
2、LinkedList
由上图我们可以看到,LinkedList的底层数据结构为双向链表。每个节点存储着数据值以及前继指针和后继指针的指向地址值。
所以我们如果要从这个双向链表中随机获取值的话,需要从表头开始进行遍历,一直遍历到我们需要获取到的值为止。这个整个过程为O(n),相对于ArrayList来说,效率确实比较低。
那么我们再来看下它的删除等操作:
由上图我们可以看出,在执行删除等操作时,LinkedList只需要更改它的前继指针和后继指针就可以了。而不用想ArrayList一样将后面的数据进行移动,所以说整体效率是比较高的,时间复杂度为O(1)。
LinkedList线程不安全问题
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
我们先来看一下LinkedList的add方法,这个方法主要做了两个操作,一个是指针指向,一个是将size++。那这里如果是多线程的情况下就会发生数据覆盖的问题。首先线程A改变了指针指向,在还未size++时挂起,然后线程B也改变指针指向,将前置指针和后继指针指向A指向的位置,执行完成后就会导致线程A的数据因为没有指针指向它,而导致数据丢失。
3、Vector
Vector跟ArrayList的底层结构是一样的,线程安全的原因是因为加了synchronized锁来保证同步执行。源码如下:
public synchronized boolean add(E e){
modCount++;
ensureCapacityHelper(elementCount +1);
elementData[elementCount++] = e;returntrue;
}