List是我们常用的java集合,我们在实际项目中使用最多的就是ArrayList了,本文从源码的角度分析一下ArrayList的具体实现。
主要变量
首先从ArrayList的实例变量开始分析。
DEFAULT_CAPACITY代表了ArrayList的默认容量,即我们不指定容量的话默认为10;EMPTY_ELEMENTDATA用于标识容量为0的集合;DEFAULTCAPACITY_EMPTY_ELEMENTDATA:在使用默认容量初始化时会先创建一个空的数组,只有在第一次添加元素的时候才将数组扩容为10,他代表了这个容量为0的数组;elementData:真正存放元素的数组; size:数组中的元素个数。还有个重要的变量我没有截图出来,因为源码写在下面了。。
MAX_ARRAY_SIZE = Integer.MAX_VALUE -8;表示List最大容量为int的最大值-8,那么为什么是-8而不是int最大值呢,因为数组作为对象的一种需要一定字节来存储元数据信息,-8是为了防止因为虚拟机差异触发溢出异常。但是其实这里的最大值在后面还可以进行扩容到最大值,这个下面会说。
构造函数
接下来看主要的构造函数:
可以看到,我们可以传递一个int值代表数组容量或者直接传递一个集合。这里有必要提的一点是,如果我们预先知道我们这个List大概需要存多少元素,我们可以在初始化的时候指定容量大小,这样避免了list自动扩容可以提高性能。
主要方法
分析完了实例变量与构造函数,让我们开始分析一下我们常用的一些方法,首先来看add方法。
我们看到在添加时首先进行了容量的校验,判断是否需要扩容以及若需要的话进行扩容操作。首先通过calculateCapacity方法计算出需要的容量大小返回minCapacity,然后再判断minCapacity是否大于目前数组的容量,如果大于的话就需要对现有数组进行扩容,我们进入相应的扩容grow方法。我们看到newCapacity的计算公式为old+old/2,如果扩容后大小比old小说明发生了溢出则将新的容量设为minCapacity。当newCapacity比我们之前定义的变量MAX_ARRAY_SIZE还要大时,就会进入hugeCapacity方法,这时我们发现此时list的最大容量最终会到达int的最大值。扩容时会调用Arrays.copyOf方法最终会调用System.arraycopy方法,这个拷贝方法是浅拷贝,也就是拷贝的引用关系。
get与set的操作就比较简单了。
先进行rangeCheck(index)判断index是否超出数组大小,然后就是简单的数组下标操作。
接下来看remove方法
移除指定下标方法原理就是将数组整个向前移动一位(实际是拷贝)即可,最后将size下标的元素置空。
移除指定元素的方法原理也很简单,首先是对null元素做了判断,然后是进行相应的查找,查找到第一个相等的元素就调用fastRemove方法进行删除并返回true,若集合中没有相应的元素即返回false。fastRemove方法的原理其实就是移除指定下标方法的原理。
接下来就是list的迭代器了,我们通常通过迭代器来遍历List,这里就有个问题,为什么JDK不让我直接操作elementData数组呢,这个就是设计模式的一种--迭代器模式,他提供了顺序遍历聚合对象的一种方式,而又不用暴露对象的内部表示,这样不管我们内部的表示是怎样的都可以通过迭代器来进行访问,同时屏蔽了内部细节也保证了安全性。迭代器还有个用途就是用于在迭代的过程中删除元素,假如我们直接使用集合的remove方法进行删除操作的话会报经典的并发修改异常。
关于并发修改异常
我们先来分析一下并发修改的发生原因
我们使用next方法进行迭代时,如果调用了List的remove方法(注意并不是iterator的remove)则会发生并发修改异常,因为remove方法对modCount进行了++操作,而next方法中调用了checkForComodification进行了expectedModCount =modCount的判断,其中expectedModCount是初始化迭代器时就指定为expectedModCount ==modCount,那么当remove后下次调用next后checkForComodification条件不成立则抛出并发修改异常。
我们来看iterator是怎么解决的。其实就一行代码,调用了list的remove方法后,执行了expectedModCount =modCount,这样下次next条件就成立了。
需要注意的是只有在使用增强for循环或者使用迭代器遍历的时候使用集合的remove方法进行删除的时候才会出异常。使用普通的for循环时若是从 0-size 进行进行遍历,删除可能会漏元素而不会报错。从size-0进行遍历则可以正确删除,虽然正确,还是推荐使用迭代器的remove方法进行删除。
接着分析迭代器:
List的迭代器有俩种,一种是通用的iterator,一种是List在迭代器的基础上进行了增强的listIterator
他继承于Itr即普通的迭代器,然后添加了获取上一个元素的方法。
ArrayList线程不安全分析
我们主要看add方法,
ensureCapacityInternal(size +1);
elementData[size++] = e;
第一个线程不安全的操作:会先检查数组容量,再进行赋值。假设现在数组容量为5,数组中已有4个元素,线程1检查ensureCap方法可以容纳,线程2检查ensureCap方法可以容纳,线程1添加元素,size变为10,线程2添加元素,但是数组并未扩容,size=10超过容量大小索引溢出异常。
第二个不安全的操作:elementData[size++] = e;这行,可以拆分为
elementData[size] = e;
size = size + 1;
线程1设置索引为size值为val,线程2设置索引size值为val2,线程1size+1,线程2size+1,导致元素丢失。
如果需要使用线程安全的list,可以使用SynchronizedList,它是在方法上添加synchronized关键字实现,也可以使用效率更高CopyOnWriteArrayList,他可以保证最终一致性,会在add的时候进行加锁控制,适合读多写少的场景
🔚