3.图解ArrayList

1. 前言

ArrayList和LinkedList是我们常用的数据结构,它们都是线性表,ArrayList是顺序存储的线性表,LinkedList是链式存储的线性表。

这篇文章主要介绍ArrayList的实现原理,下一篇文章详细介绍LinkedList以及两者的异同。

2. 线性表

线性表是n个相同特性的数据元素的有限序列,其中n为大于等于0的整数,当n为0时,表示空表;当n大于1时,头部元素没有前驱,尾部元素没有后继,其他元素有且只有一个直接前驱和一个直接后继。

一图抵千言,下面是线性表的示意图:


image.png

我们知道,线性表最大的特点就是元素之间的关系是一对一的。

我们在第一章中有对比过四种逻辑结构,如下所示:


image.png

3. 物理结构来划分

我们知道,线性结构是按照逻辑结构来划分的,而对于线性表来说,我们又可以按照物理结构来进一步划分,在第一章中也提到了两种物理结构分别为顺序存储结构和链式存储结构。

3.1 顺序存储结构

顺序存储结构就是元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。


顺序存储结构

如下图所示,假设我们每个元素占据4个存储单元,且该线性表在内存中的首个位置为101,则整个线性表存储的方式如下所示

image.png

我们用Loc(ai)表示第i个元素在内存中的地址,c表示的每个元素需要的存储单元个数,则有如下结论:

Loc(ai + 1) = Loc(ai) + c

Loc(ai) = Loc(a1) + (i-1) * c

3.2 链式存储结构

链式存储结构把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。


链式存储结构

如下所示,除了需要存储数据本身(数据域)以外,还需要使用额外的空间存储(指针域)指向下一个元素的地址


image.png

当我们需要找到某个元素时,就需要先找到前一个元素,以此类推

而我们本文中要详细介绍的ArrayList就是顺序存储结构;下章需要详细介绍的LinkedList就是链式存储结构。下面我们就先详细讲解ArrayList的实现原理

4. ArrayList

4.1 构造方法

ArrayList有三个构造方法,我们先来看默认的构造方法

    public ArrayList() {
        this(10);
    }

直接调用了initalCapacity为10的有参构造方法

    private transient Object[] elementData;

    public ArrayList(int initialCapacity) {
        super();
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        this.elementData = new Object[initialCapacity];
    }

在有参的构造方法里,主要就是创建了一个长度为initialCapacity,类型为Object的数组,而这里的elementData就是我们ArrayList真正存放数据的数组了。

通过构造方法,我们知道

  1. ArrayList是基于数组实现的
  2. 默认的ArrayList构造方法,其实就是创建了一个长度为10的Object数组elementData
  3. ArrayList支持有参的构造方法,其中参数initialCapacity用于指定存放数据的数组elementData 的初始化长度

我们通过new ArrayList()代码时,其实就是创建了如下图的数组elementData


ArrayList默认构造方法.png

其实,ArrayList还有一个参数为Collection的构造方法

    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        size = elementData.length;
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    }

可以看出,这个构造函数其实就是用传入的集合c去创建一个Object[] elementData

4.2 添加元素 add(E e)

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

新增元素的流程主要有如下三步

  1. 首先调用ensureCapacityInternal来确保加入一个元素以后,没有超出当前存储数据的数组elementData的长度,如果超出了,则需要进行扩容
  2. 然后再把新加入的元素e放到数组elementData第一个没有赋值的地方(其实就是插入到ArrayList的尾部)
  3. 最后ArrayList的长度size自增。

我们先来看看ensureCapacityInternal是如何确保elementData的容量的:

    private void ensureCapacityInternal(int minCapacity) {
        modCount++;
        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

当我们需要的ArrayList长度大于elementData长度时,表示当前数组不能再添加新的元素了,则需要调用grow方法进行扩容,我们看看grow方法

    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

这个方法的作用其实就是对存放数据的数组elementData 进行扩容,首先,某人扩容的长度newCapacity 为1.5倍之前数组的长度,然后再和需要的长度做比较,如果需要的长度大于1.5倍原来的长度,那扩容以后的长度就为需要的长度

后面是对数组允许最大长度的处理,一般不会触发。

最后,调用Arrays.copyOf方法去创建一个长度为newCapacity的新数组,并且把原有数据复制进去

举例说明:

假如我们开始通过默认方式创建了一个ArrayList,也就是elementData是长度为10的Object[],然后我们一次把a~j一共10个字母加入到ArrayList,这个时候,elementData已经满了,我们还想加入字母k,就需要扩容了,经过计算可得扩容后的数组elementData长度为:10 * 1.5 = 15,然后再把扩容前的数据复制到扩容后的数组中

这只是完成elementData的扩容,接下来,再通过elementData[size++] = e;把要加入的元素k放到elementData的size位置,如下图所示:

ArrayList添加元素.png

可以看出,添加元素的时间复杂度为O(1)

另外,当我们ArrayList需要加入元素时,如果当前elementData不足以存放新加入的元素时,就需要扩容,所以如果当我们事先知道我们加入数据的大致规模,我们就可以通过ArrayList(int initialCapacity) 构造函数来创建ArrayList,这样就可以初始化一个与我们数据规模相当的elementData,从而减少扩容的次数。

4.3 增加集合 addAll(Collection<? extends E> c)

ArrayList除了增加一个元素的方法,还可以增加一个集合,和增加元素类似,增加集合也是加入到ArrayList的尾部,代码如下:

    public boolean addAll(Collection<? extends E> c) {
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount
        System.arraycopy(a, 0, elementData, size, numNew);
        size += numNew;
        return numNew != 0;
    }

可以看到,新增集合的步骤也有如下三步:

  1. 调用ensureCapacityInternal去确定数组是否要扩容时,传入的参数为ArrayList原本的长度+新增集合的长度
  2. 存入新增集合数据时,调用System.arraycopy方法把新增集合放到数组elementData第一个没有赋值的地方(其实就是插入到ArrayList的尾部)
  3. ArrayList的size增加新增集合的长度

还是之前的例子,只不过这时候我们不是只加入元素k,而是加入了一个集合,这个集合中有元素k、l、m、n,示意图如下


ArrayList添加集合.png

4.4 取数据 get(int index)

    public E get(int index) {
        rangeCheck(index);

        return elementData(index);
    }

首先,调用了rangeCheck去检测index是否超过ArrayList的长度,如果超过,则会抛出著名的IndexOutOfBoundsException错误,我们来看看rangeCheck方法就知道了

    private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

确定index合法以后,就调用elementData去获取值了,我们来看看elementData方法

    E elementData(int index) {
        return (E) elementData[index];
    }

这里就是直接从elementData中取出数据返回即可

所以ArrayList的get(index)方法主要就是如下两步:

  1. 检测index是否合法
  2. 从elementData从取出下标为index的元素

举例:
比如我们的ArrayList已经加入了a~k这11个元素,这时候我们想得到arrayList.get(5),就能通过elementData[5]轻松取出元素f了,示意图如下:

ArrayList取值.png

可见,ArrayList的get方法的时间复杂度为O(1)

4.5 插入元素 add(int index, E element)

    public void add(int index, E element) {
        rangeCheckForAdd(index);

        ensureCapacityInternal(size + 1);  // Increments modCount!!
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        elementData[index] = element;
        size++;
    }

我们知道ArrayList是基于数组来实现的,那插入一个元素怎么来实现呢?其实就是把要插入的位置的元素已经后面的元素,都往后面挪动一个位置(这里的挪动其实不是真正地往后挪动,而是element[index+1] = elementData[index]),从上面的代码也可以看出,插入的逻辑如下:

  1. 检查index的合法性
  2. 调用ensureCapacityInternal进行有可能的扩容
  3. 调用System.arraycopy去把数组index以及后面的数据往后挪动一个位置
  4. 把插入的元素element放入数组elementData的index处
  5. ArrayList的长度size自增

那时间复杂度是多少呢?其实这里花费的时间主要是由System.arraycopy方法决定的,它的时间复杂度为O(n),所以ArrayList插入数据的时间复杂度为O(n)

ArrayList插入的示意图:

ArrayList插入元素.png

4.6 插入集合 addAll(int index, Collection<? extends E> c)

    public boolean addAll(int index, Collection<? extends E> c) {
        // 检查index的合法性
        rangeCheckForAdd(index);
        
        Object[] a = c.toArray();
        int numNew = a.length;
        // 进行可能需要的扩容
        ensureCapacityInternal(size + numNew);  // Increments modCount
        
        // 需要移动元素的个数
        int numMoved = size - index;
        if (numMoved > 0)
            // index后面的元素,往后移动numNew个位置
            System.arraycopy(elementData, index, elementData, index + numNew,
                             numMoved);
        // 把插入的结合插入到移动过后空出来的elementData的相应位置
        System.arraycopy(a, 0, elementData, index, numNew);
        // ArrayList的长度size增加numNew个
        size += numNew;
        return numNew != 0;
    }

之前已经了解了添加集合和插入元素的只是,这里直接看上面的注释就可以了,下面是ArrayList插入集合的示意图:

举例,我们的ArrayList已经存在a~j这10个元素,现在又要在index=5的位置插入


ArrayList插入集合.png

4.7 删除元素 remove(int index)

    public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            // index后面的元素,都往前挪动一个位置
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
         // 把最后ArrayList的最后一个元素设置为空
        elementData[--size] = null; // Let gc do its work

        return oldValue;
    }

我们知道插入的操作原理了,那删除的原理也类似,把index位置以及后面的元素往前挪动一个位置(这里的往前挪动一个位置,也不是真正意义上的挪动,而是elementData[index-1] = elementData[index]),并把最后一个元素位置为null

示意图如下:


ArrayList删除元素.png

因为需要移动size - index个元素,所以删除的时间复杂度为O(n)

4.8 查找 contains(Object o)

    public boolean contains(Object o) {
        return indexOf(o) >= 0;
    }

    public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

查找的思想,就很简单粗暴了,直接遍历elementData数组,如果当前元素与待查找元素相同,则返回当前元素的下标位置,所以查找的时间复杂度为O(n)

5. 总结

  1. ArrayList是基于数组来实现的
  2. ArrayList各种操作的时间复杂度如下
序号 操作 时间复杂度
1 增加 O(1)
2 获取 O(1)
3 插入 O(n)
4 删除 O(n)
5 查找 O(n)
  1. 由3可知,ArrayList比较适合存取比较多的操作;不太适合插入、删除、查找比较多的操作
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容