深入学习Java之ArrayList

深入学习Java之ArrayList

前言

对于Java的容器类,虽然之前一直有在使用,不过使用归使用,很多的原理本质上还是不懂,比如说什么时候进行扩容等,乘着最近有空,每天抽出点时间来重新学习下容器类,主要包括了(Collection、Map),其中Collection主要包括List、Set、Queue等,本小节主要来学习List中的ArrayList

ArrayList的继承结构

首先从宏观上来了解ArrayList的结构,然后再从源码的角度来学习。

ArrayList的继承结构如下所示
ArrayList继承结构

从上图中可以看到,ArrayList继承自AbstractList,并且实现了RandomAccess、Clonable、Serializable接口,而其中的AbstractList又实现了AbstractCollection接口,并且继承了List接口,AbstractCollection实现了Collection接口,List继承了Collection接口,Collection接口又继承了Iterable接口。

接下来我们根据上图,从上到下来逐个类、接口来学习

首先是Iterable接口

Iterable接口

从上图中可以看到,Iterable接口中主要提供了iterator方法,用于返回一个Iterator对象,主要用于遍历容器(foreach)

接下来是Collection接口

Collection接口

从上图中可以看到,Collection接口基本上定义了操作容器的基本方法,包括了获取容器大小的size方法,判断容器是否为空的isEmpty方法,判断容器是否包含某个元素的contains方法,将容器的内容装换为数组的toArray方法,添加元素的add方法,移除元素的remove方法等,这些方法都是操作容器的最基本的方法,在对应的实现类中,不同的容器实现类将根据自身的特性,对不同的方法进行相应的实现。

接下来是AbstractCollection接口,AbstractCollection是一个抽象类,主要实现了Collection接口中的部分通用方法,具体如下代码所示


    public boolean contains(Object o) {
        // 获得迭代器对象
        Iterator<E> it = iterator();
        // 判断对象是否是NULL,如果是NUll,则查看容器中是否
        // 有对象也是NULL
        if (o==null) {
            while (it.hasNext())
                if (it.next()==null)
                    return true;
        } else {
            // 如果不是NULL,则查看容器中是否包含该方法
            while (it.hasNext())
                if (o.equals(it.next()))
                    return true;
        }
        return false;
    }

    // 原理同上
    public boolean remove(Object o) {
        Iterator<E> it = iterator();
        if (o==null) {
            while (it.hasNext()) {
                if (it.next()==null) {
                    it.remove();
                    return true;
                }
            }
        } else {
            while (it.hasNext()) {
                if (o.equals(it.next())) {
                    it.remove();
                    return true;
                }
            }
        }
        return false;
    }

    // 将容器转化为数组
    public Object[] toArray() {
        // 默认大小为容器中元素的个数
        Object[] r = new Object[size()];
        Iterator<E> it = iterator();
        for (int i = 0; i < r.length; i++) {
            // 当发现容器中的元素个数没有那么多时,将数组进行缩减
            if (! it.hasNext()) // fewer elements than expected
                return Arrays.copyOf(r, i);
            r[i] = it.next();
        }
        // 当发现容器中个数多余size时,进行扩容,并将剩余元素添加到数组中
        return it.hasNext() ? finishToArray(r, it) : r;
    }

    // 将容器中剩余的元素加入到数组中
    private static <T> T[] finishToArray(T[] r, Iterator<?> it) {
        int i = r.length;
        while (it.hasNext()) {
            int cap = r.length;
            if (i == cap) {
                // 当发现数组容量不足时,进行扩容,扩容后大小为原来的大小+原来大小的1/2 + 1
                int newCap = cap + (cap >> 1) + 1;
                // 对扩容后的大小进行判断,防止容量过大
                // 其中的 MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
                // 也就是如果扩容后的大小大于Integer.MAX_VALUE - 8,则进行
                // 容量判断,防止其整数溢出
                if (newCap - MAX_ARRAY_SIZE > 0)
                    newCap = hugeCapacity(cap + 1);
                r = Arrays.copyOf(r, newCap);
            }
            r[i++] = (T)it.next();
        }
        // 如果数组容量由空余,则进行缩减至数组容量大小
        return (i == r.length) ? r : Arrays.copyOf(r, i);
    }
    // 限制数组容量
    private static int hugeCapacity(int minCapacity) {
        // 如果新容量太大,造成整数溢出,则抛出异常
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError
                ("Required array size too large");
        // 如果大于允许的最大容量,则将其限制在Integer.MAX_VALUE
        // 否则则将其限制在MAX_ARRAY_SIZE
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

当然,AbstractCollection中还有其他一些方法,不过,由于在具体的实现类中,可能对应的实现不同,所以这里就不进行其源码的研究,等到具体的实现类中再进行研究

接下来是List接口

由于List接口继承自Collection接口,所以Collection中有的方法List也自然有,不过,除此之外,List还增加了几个新的方法,主要用于针对List的操作
List的新增方法

从上图中可以看到,主要是获取指定位置的get方法,将某个位置的元素设置为新的值的set方法,获取某个元素在List中的索引的indexOf、LastIndexOf方法,以及List增加的用于获取新的迭代器的ListIterator方法

接下来是AbstractList,正如AbstractCollection之于Collection,AbstractList是List的实现,主要实现了几个常用的方法,这里同样不进行展开

从ArrayList的结构图中可以看到,ArrayList除了AbstractList和实现了List接口之外,还实现了RandomAccess、Cloneable、Serializable接口,其中RandomAccess、Cloneable和Serializable接口均是标记接口,RandomAccess用于标记ArrayList支持随机访问,Cloneable接口用于标记ArrayList支持克隆,Serializable接口用于标记ArrayList支持序列化

ArrayList的源码剖析

上面从宏观上了解了ArrayList的继承结构,总体把握了ArrayList的方法之后,接下来我们来详细地学习ArrayList的源码

ArrayList的组成


transient Object[] elementData;

可以看到,ArrayList的底层实现其实就是一个Object数组,这也是为什么ArrayList称之为ArrayList的原因了

接下来来学习ArrayList的构造方法


    // 带初始容量的初始化方法
    public ArrayList(int initialCapacity) {
        // 如果初始容量大于0,则使用该容量进行创建数组
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        // 如果容量是0,则使用默认的的空数组对象,其中的EMPTY_ELEMENTDATA定义如下
        // private static final Object[] EMPTY_ELEMENTDATA = {}; 
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        // 如果容量小于0,则抛出异常
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
        }
    }
    // 无参构造方法,也是默认的构造方法
    public ArrayList() {
        // 默认也是初始化为空数组
        // private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    // 带一个容器对象的构造方法,主要用于将容器中的所有对象来初始化ArrayList对象
     public ArrayList(Collection<? extends E> c) {
        // 将Collection转化为数组对象
        elementData = c.toArray();
        // 如果传进来的Collection中有元素,则将元素添加到数组中
        if ((size = elementData.length) != 0) {
            // 如果转化后的数组不是Object类型,则初始化为实际类型
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        // 否则将其初始化为空容量
        } else {
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

获取某个元素


    public E get(int index) {
        // 对index的范围进行检查
        rangeCheck(index);

        return elementData(index);
    }

    // 对index的范围进行检查,由于对数组进行访问时,负数索引会抛出异常
    // 所以这里不需要进行额外检查,但是由于此时数组的容量并不代表所有的
    // 位置都是有效元素,所以需要进行检查
    private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

将指定位置的元素替换为指定元素


    public E set(int index, E element) {
        rangeCheck(index);
        // 替换旧值并且返回旧值
        E oldValue = elementData(index);
        elementData[index] = element;
        return oldValue;
    }

添加某个元素

    // 默认添加在最后面
    public boolean add(E e) {
        // 进行容量检测
        ensureCapacityInternal(size + 1); 
        elementData[size++] = e;
        return true;
    }
    // 容量检测
    private void ensureCapacityInternal(int minCapacity) {
        // 如果是此时的数组的默认的空数组,则将其容量初始化为
        // max(默认容量(10), 此时所需要的最小容量)
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        // 判断此时容量是否足够
        ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
        // 记录对ArrayList结构进行操作
        modCount++;

        // 如果所需要的容量大于数组此时的长度,则增长数组
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

    // 动态增长,注意这里比较耗费资源
    private void grow(int minCapacity) {

        int oldCapacity = elementData.length;
        // 大小为旧容量大小+ 1/2 旧容量大小
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        // 如果新容量大小小于所需要的大小,则将大小设置为实际所需要的大小
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        // 如果新容量大小大于允许的最大值,则进行容量检测,看是否移出
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // 重新创建数组并且将大小调整为新容量
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

    // 检查容量大小是否溢出
    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

在指定位置插入元素


    public void add(int index, E element) {
        rangeCheckForAdd(index);

        // 同上,进行容量检测并在需要时进行动态增长
        ensureCapacityInternal(size + 1);
        // 将要插入的位置的元素后面所有元素后移
        // 这里可以看出,ArrayList在中间插入元素是比较消耗资源的
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        elementData[index] = element;
        size++;
    }

添加一个容器中的所有元素


    // 基本原理同上,这里不进行过多的解析
    public boolean addAll(Collection<? extends E> c) {
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount
        System.arraycopy(a, 0, elementData, size, numNew);
        size += numNew;
        return numNew != 0;
    }

移除指定位置元素


    public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        // 如果要移出的元素不是最后一个元素,则进行紧凑
        // 从这里也可以看到,ArrayList在中间移除元素是比较消耗资源的
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

在指定位置添加所有的元素


    // 基本原理同上,不做过多解析
    public boolean addAll(int index, Collection<? extends E> c) {
        rangeCheckForAdd(index);

        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount

        int numMoved = size - index;
        if (numMoved > 0)
            System.arraycopy(elementData, index, elementData, index + numNew,
                             numMoved);

        System.arraycopy(a, 0, elementData, index, numNew);
        size += numNew;
        return numNew != 0;
    }

移除指定值的元素


    // 移除第一个匹配的值
    public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

    // 基本原理同上,移除后进行紧凑
    private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }

移除所有元素


    public void clear() {
        modCount++;

        // 这里需要注意,由于数组中的元素是通过引用关系跟
        // 具体的对象关联的,所有如果此时只是简单的移动索引
        // 那么这些元素所占用的内存依旧不会被GC,因为依旧保持
        // 跟数组的管理,GC回收是不会对这种对象进行回收的
        // 这里写得非常棒,非常值得学习
        for (int i = 0; i < size; i++)
            elementData[i] = null;

        size = 0;
    }

查找某个元素的索引以及查找从后往前找某个元素的索引基本同AbstractCollection,这里就不进行展开了

克隆数组


    public Object clone() {
        try {
            ArrayList<?> v = (ArrayList<?>) super.clone();
            v.elementData = Arrays.copyOf(elementData, size);
            v.modCount = 0;
            return v;
        } catch (CloneNotSupportedException e) {
            // this shouldn't happen, since we are Cloneable
            throw new InternalError(e);
        }
    }

手动触发容量检测


    public void ensureCapacity(int minCapacity) {
        // 如果是默认的空数组,则容量为0,否则容量为10
        int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA) ? 0 : DEFAULT_CAPACITY;
        // 对最小容量与需要的容量进行判断,并根据需要进行容量扩展
        if (minCapacity > minExpand) {
            ensureExplicitCapacity(minCapacity);
        }
    }

手动将ArrayList中数组的大小进行确定,限制为实际的大小


    public void trimToSize() {
        modCount++;
        if (size < elementData.length) {
            elementData = (size == 0) ? EMPTY_ELEMENTDATA : Arrays.copyOf(elementData, size);
        }
    }

对与ArrayList中的Iterator以及ListIterator的源码,目前还没看懂,所以暂时无法进行研究,等以后研究懂了再进行补充

总结

本小节主要从宏观上学习了ArrayList的结构,以及从ArrayList的源码中研究了ArrayList的底层实现,以及ArrayList的扩容,紧凑原理(数组的拷贝,移动),从本质上明白了为何ArrayList在中间进行插入,删除会带来严重性能的原因(数组元素的移动),加深了对ArrayList的认识。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容

  • Java源码研究之容器(1) 如何看源码 很多时候我们看源码, 看完了以后经常也没啥收获, 有些地方看得懂, 有些...
    骆驼骑士阅读 993评论 0 22
  • title: java集合框架学习总结 tags:集合框架 categories:总结 date: 2017-03...
    行径行阅读 1,682评论 0 2
  • 在经过一次没有准备的面试后,发现自己虽然写了两年的android代码,基础知识却忘的差不多了。这是程序员的大忌,没...
    猿来如痴阅读 2,838评论 3 10
  • java笔记第一天 == 和 equals ==比较的比较的是两个变量的值是否相等,对于引用型变量表示的是两个变量...
    jmychou阅读 1,495评论 0 3
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,617评论 18 399