ArrayList 与 LinkedList 底层结构

原文来自个人博客:ArrayList 与 LinkedList 底层结构 | Kori Lin

在 Java 中,数组可用来存储相同类型的多个数据,但由于长度不可变,在某些场景下使用比较局限。当我们希望使用类似数组的结构来存储未知个数的元素时,可以使用 ArrayList<E>LinkedList<E>,它们都是 Java Collection Framework 的成员,相比普通的数组,它们提供了更多的操作来方便我们开发。由于底层使用的数据结构不同,它们也经常被拿来做比较。

继承关系

ArrayList 属于 List<E> 接口中的一个 可变长数组 实现,直接 extends AbstractList<E> abstract 类。其继承关系如下:

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
ArrayList

LinkedList 直接 extends AbstractSequentialList<E> abstract 类,间接 extends AbstractList<E>,由于 LinkedList 也实现了 Deque<E> 接口,所以它属于 List<E>Queue<E> 接口的实现。

public class LinkedList<E> extends AbstractSequentialList<E>
    implements List<E>, Deque<E>, Cloneable, java.io.Serializable
LinkedList

ArrayList

底层结构

对于 ArrayList,Java API 对它的第一句描述为 “Resizable-array implementation of the List interface”。其底层存储元素的结构为 Object 数组。

private static final int DEFAULT_CAPACITY = 10;

private static final Object[] EMPTY_ELEMENTDATA = {};

private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

transient Object[] elementData;

ArrayList 存储元素的数组对象变量名为 elementData,在使用 new ArrayList() 创建对象时使用 DEFAULTCAPACITY_EMPTY_ELEMENTDATA(一个长度为 0 的数组)来对 elementData 进行初始化。

private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

ArrayList 有一个构造方法 ArrayList(int initialCapacity) 让我们传入一个 int 类型的参数,这可以让我们在创建 ArrayList 对象时对 elementData 进行自定义的初始化,ArrayList 会将传入的 initialCapacity 参数来作为初始化 elementData 的长度。当 initialCapacity 是 0 时,使用 EMPTY_ELEMENTDATA 以一个长度为 0 的数组来初始化 elementData。

private static final Object[] EMPTY_ELEMENTDATA = {};

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                            initialCapacity);
    }
}

可变长原理

ArrayList 使用数组来存储元素,而数组长度是固定的,添加的元素数量可能会超过数组容量,并且如果我们创建 ArrayList 对象时不指定 initialCapacity 或指定为 0 的话,那么 elementData 的长度是 0,无法放入元素。因此如果希望 ArrayList 是可变长的,需要有一个扩容机制。

在 ArrayList 中,每次添加元素都会先调用 ensureCapacityInternal(int minCapacity) 方法,之后才会进行添加操作,只要完成了添加操作,add(E e) 方法总是会返回 true 来表示添加成功。那么关键的代码就在于 ensureCapacityInternal 这个方法做了哪些操作。

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}
private static final int DEFAULT_CAPACITY = 10;

private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    return minCapacity;
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;

    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

ensureCapacityInternal 方法传入的参数 minCapacity 为进行添加操作时 elementData 所需的最小容量,方法内可以分为两步操作:

  1. 第一步调用 calculateCapacity(Object[] elementData, int minCapacity) 来计算 elementData 所需容量。

    • 当 elementData 为 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 时,代表 elementData 需要进行初始化扩容。ArrayList 中有一个默认的数组初始化容量大小 DEFAULT_CAPACITY = 10,ArrayList 添加第一个元素时,以该值作为数组长度进行初始化扩容。
    • 由于 ArrayList 中有 addAll(int index, Collection<? extends E> c) 方法来添加多个元素,添加的元素个数可能比 DEFAULT_CAPACITY 的值要大,因此需要比较 minCapacity 与 DEFAULT_CAPACITY 的大小,取大的一个作为 elementData 所需容量进行返回。
    • 当 elementData 已经进行过初始化扩容时,直接将 minCapacity 作为所需容量返回。
  2. 第二步调用 ensureExplicitCapacity(int minCapacity) 方法根据所需容量大小来判断是否需要进行扩容,如果所需容量大于当前 elementData 的容量,则调用 grow(int minCapacity) 方法进行扩容操作。

扩容方式

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

private static int hugeCapacity(int minCapacity) {
    if (minCapacity < 0) // overflow
        throw new OutOfMemoryError();
    return (minCapacity > MAX_ARRAY_SIZE) ?
        Integer.MAX_VALUE :
        MAX_ARRAY_SIZE;
}

grow 方法中扩容方式为使用 Arrays.copyOf(T[] original, int newLength) 方法来生成一个包含原数组元素的新数组,而新数组容量 newCapacity 取决于 oldCapacity(原本 elementData 的容量),在原本 elementData 的容量上增加一半,这个操作通过对 oldCapacity 进行右移完成。

当得到的 newCapacity 比所需的最小容量小时,将会直接使用 minCapacity 作为 newCapacity 的值。

当 elementData 为 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 时,代表原本长度为 0,则 newCapacity 的值也为 0,那么 newCapacity - minCapacity 将会小于 0,此时新数组容量将会变成 minCapacity,也就是 DEFAULT_CAPACITY,从而初步扩容出一个容量为 10 的 elementData。

最大容量

ArrayList 存放元素的结构为数组,因此 ArrayList 的最大容量也取决于数组的最大容量。

在 ArrayList 中使用 MAX_ARRAY_SIZE 来代表数组最大长度,数组的长度定义为非负的 int 类型,因此数组的最大长度为 int 类型的最大值。由于在一些虚拟机中,一个数组还包括头部等内容,因此最大长度可能会比 int 的最大值要小,所以 ArrayList 的 MAX_ARRAY_SIZE 的值为 Integer.MAX_VALUE - 8

当通过计算得出的 newCapacity 大小比 MAX_ARRAY_SIZE 大时,将会调用 hugeCapacity(int minCapacity) 来尝试获取数组的可能的最大值来作为 newCapacity 的值。

当 minCapacity 的值为负数时,代表所需最小容量超过了 int 类型最大值,发生了溢出,此时将会在 hugeCapacity 方法内主动抛出 OutOfMemoryError。如果不为负数时,当 minCapacity 比 MAX_ARRAY_SIZE 大的话,则尝试使用 Integer.MAX_VALUE 来作为容量大小,否则使用 MAX_ARRAY_SIZE

LinkedList

链表结构

LinkedList 的底层使用的结构是双向 Node 链表,在 LinkedList 中有 firstlast 两个变量,分别指向链表的第一个节点和最后一个节点,默认为 null,并用 size 来存储链表的长度。Node 节点创建时,必须传入节点值和前后节点,因此 Node 类中没有无参构造方法。

transient int size = 0;

transient Node<E> first;

transient Node<E> last;

private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

头尾操作

private void linkFirst(E e) {
    final Node<E> f = first;
    final Node<E> newNode = new Node<>(null, e, f);
    first = newNode;
    if (f == null)
        last = newNode;
    else
        f.prev = newNode;
    size++;
    modCount++;
}

void linkLast(E e) {
    final Node<E> l = last;
    final Node<E> newNode = new Node<>(l, e, null);
    last = newNode;
    if (l == null)
        first = newNode;
    else
        l.next = newNode;
    size++;
    modCount++;
}

LinkedList 中使用 linkFirstlinkLast 来将节点添加到首部和尾部,当我们使用添加方法来添加节点时,都是使用这几个方法完成。

public boolean add(E e) {
    linkLast(e);
    return true;
}

public void addFirst(E e) {
    linkFirst(e);
}

public void addLast(E e) {
    linkLast(e);
}

此外还有一个 linkBefore 来将节点插入到指定位置,但它并不是总被调用,当添加的位置刚好在链表末尾时,则使用 linkLast 来完成插入操作。

void linkBefore(E e, Node<E> succ) {
    // assert succ != null;
    final Node<E> pred = succ.prev;
    final Node<E> newNode = new Node<>(pred, e, succ);
    succ.prev = newNode;
    if (pred == null)
        first = newNode;
    else
        pred.next = newNode;
    size++;
    modCount++;
}

public void add(int index, E element) {
    checkPositionIndex(index);

    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}

作为队列使用

由于实现了 Deque<E> 接口,LinkedList 也可以作为队列来使用,我们可以同时使用 Queue 的方法来操作元素。但当一个 LinkedList 具有特定的含义并明确为一个队列时,应当声明为 Deque 类型,避免使用链表操作干扰队列正常的进出流程。

class E { /* Deque Element Type */ }

Deque<E> deque = new LinkedList<>();

区别和使用场景

ArrayList 由于其底层结构为数组这一特点,在使用 get 通过获取元素时,可以通过下标直接映射到相对应的元素,随机访问时所需时间复杂度为 O(1)。但在插入时,需要对插入位置和后面的元素进行移动,在 ArrayList 的 size 比较大时,这可能需要花费较多的时间。

public void add(int index, E element) {
    rangeCheckForAdd(index);

    ensureCapacityInternal(size + 1);  // Increments modCount!!
    System.arraycopy(elementData, index, elementData, index + 1,
                        size - index);
    elementData[index] = element;
    size++;
}

在 ArrayList 中,这一操作使用 System.arraycopy() 来对需要移动的元素进行复制,从而提高元素移动操作的效率,但每次添加或插入元素时,不可避免地需要调用 ensureCapacityInternal 来判断所需容量是否足够,当不充足时需要进行扩容操作。

ArrayList 使用数组来存储元素,在扩容时会出现没有使用的空间,造成空间浪费,在数据量越大的情况下,造成的空间浪费可能会越大。

空间浪费

LinkedList 底层的数据结构为链表,每次查询元素时,需要移动指针来查找对应元素,随机访问时的时间复杂度为 O(n),要比 ArrayList 慢的多,但在顺序访问的情况下,两者并没有太大区别。而插入时只需要修改前后节点指向,不需要直接移动链表中的元素,效率比 ArrayList 要高。

由于链表需要为每一个节点创建一个 Node 对象,来存储数据的引用和前后节点的引用,因此每一个节点所占用的内存会比 ArrayList 一个元素占用的多。大部分情况下,或在不考虑 ArrayList 空间浪费的情况下,LinkedList 的开销会比 ArrayList 大。

因此,ArrayList 更适合于简单的存储、随机访问对应位置数据的场景,如果需要频繁对容器的元素进行增删操作,那么可以使用 LinkedList 来提高代码的性能。

参考

JDK 1.8 源码 与 Java API 文档:
https://docs.oracle.com/javase/8/docs/api/java/util/List.html
https://docs.oracle.com/javase/8/docs/api/java/util/ArrayList.html
https://docs.oracle.com/javase/8/docs/api/java/util/LinkedList.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,525评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,203评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,862评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,728评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,743评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,590评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,330评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,244评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,693评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,885评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,001评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,723评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,343评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,919评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,042评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,191评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,955评论 2 355

推荐阅读更多精彩内容