Java集合框架-List和Set

Java集合框架1-List和Set

集合框架简介

Java提供了一系列的集合,主要包括util包下边的ArrayList,LinkedList,HashMap,HashTable,HashSet,LinkedHashMap,LinkedHashSet,TreeMap,TreeSet,ArrayDeque,PriorityQueue, EnumMap,Vector,Stack

Concurrent包中的ConcurrentHashMap,CopyOnWriteArrayList,CopyOnWriteArraySet,ArrayBlockingQueue,ConcurrentLinkedDequeue,ConcurrentLinkedQueue

List.png

从上边的结构构可以看出来,Set和List最底层都是实现了Collection接口的,Collection接口z主要方法如下:


    int size();
    boolean isEmpty();
    boolean contains(Object o);
    Iterator<E> iterator();
    Object[] toArray();
    <T> T[] toArray(T[] a);
    boolean add(E e);
    boolean remove(Object o);
    boolean containsAll(Collection<?> c);
    boolean addAll(Collection<? extends E> c);
    boolean removeAll(Collection<?> c);
    boolean retainAll(Collection<?> c);
    void clear();
    default boolean removeIf(Predicate<? super E> filter)

可以看到,除了常见方法之外,由于Collection继承了Iterable,所以还有一个iterator()方法,也就是说,Set和List都可以通过Iterator来遍历。

ArrayList

ArrayList可以说是最常用的集合了。它的构造方法如下:


    private static final int DEFAULT_CAPACITY = 10;

    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    private static final Object[] EMPTY_ELEMENTDATA = {};

    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }


    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
            //c.toArray()返回的可能不是Object[],而ArrayList存储数据用的就是Object[],这时候就需要将elementData转换成Object[]
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

三个构造方法,第一二两个,实际上是创建了一个可以指定容量的空的Object数组。区别在于,无参构造函数将存储数组elementData指向了DEFAULTCAPACITY_EMPTY_ELEMENTDATA,它和EMPTY_ELEMENTDATA的区别马上我们就可以看到。

第三个不常用的构造函数,可以接受一个实现了Collection接口的集合作为参数,并将它的值全部复制进来

List创建完成以后,添加数据使用的add方法有以下几个:

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

    public void add(int index, E element) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        ensureCapacityInternal(size + 1);  // Increments modCount!!
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        elementData[index] = element;
        size++;
    }

两个方法基本相同,第二个方法可以指定位置插入元素,插入之后,后边的元素index全部增加+1,长度同时增加,不指定位置的时候,在数组最后一位插入数据,插入数据之前,需要通过ensureCapacityInternal方法来扩容,源码如下:

private void ensureCapacityInternal(int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

ensureCapacityInternal方法中,第一步先判断了是不是DEFAULTCAPACITY_EMPTY_ELEMENTDATA,如果是的话,说明list是通过无参构造方法创建的,扩容值取DEFAULT_CAPACITYsize+1中的较大者,DEFAULT_CAPACITY值为10,这里就清楚了:

通过new ArrayList(0)new ArrayList()创建的list,初始容量都是0,但是在add一个元素的时候,前者容量会变成0+1=1,而后者会直接直接将容量变成默认值:10

扩容最终是通过grow方法实现的:新的容量先确定为原来的1.5倍,同时确保扩容的容量不能比原来小,也不能超过最大值,确定了长度之后,再把数据拷贝进来。

再来看一下移除数据的remove方法:

    public E remove(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        modCount++;
        E oldValue = (E) elementData[index];

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

    public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

    private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }

相比add方法,remove就比较简单了,传入int参数,表示按索引移除,传入Object表示按值移除,按值移除时,需要先判断值是不是null,null用 == 来判断,否则用 equals 方法判断,最终的移除是通过System.arraycopy(elementData, index+1, elementData, index,numMoved);来实现的:保留index之前的数据不变,从 index+1 开始复制数据到 index 的位置,将最后一位赋值为null(释放对象)

LinkedList

LinkedList内部实现使用链表的形式,构造方法如下:

    public LinkedList() {
    }
    public LinkedList(Collection<? extends E> c) {
        this();
        addAll(c);
    }

非常简单,除了复制数据之外,没有任何初始化工作。,下边看add方法:

    public boolean add(E e) {
        linkLast(e);
        return true;
    }
    public void add(int index, E element) {
        checkPositionIndex(index);

        if (index == size)
            linkLast(element);
        else
            linkBefore(element, node(index));
    }

    void linkLast(E e) {
        final Node<E> l = last;//新建对象 l 指向原来的链表尾部数据(last是指向尾部数据的成员变量)
        final Node<E> newNode = new Node<>(l, e, null);//新建一个节点,pre指针指向原来的尾部 l 
        last = newNode;//成员变量last指向新的尾部:newNode
        if (l == null)//如果 l 是空的,说明原来没有数据,所以,新建的节点是头部
            first = newNode;
        else //不是空的说明原来有数据,将原来的尾部数据 l 的next指针指向新的尾部: newNode
            l.next = newNode;
        size++;
        modCount++;
    }

    void linkBefore(E e, Node<E> succ) {
        // assert succ != null;
        final Node<E> pred = succ.prev;
        final Node<E> newNode = new Node<>(pred, e, succ);
        succ.prev = newNode;
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        size++;
        modCount++;
    }

如果不指定index,直接将元素添加在链表尾部,否则添加在指定位置。

接下来看取值方法get:

    public E get(int index) {
        checkElementIndex(index);
        return node(index).item;
    }

    Node<E> node(int index) {
        // assert isElementIndex(index);

        if (index < (size >> 1)) {
            Node<E> x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else {
            Node<E> x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }

采用链表形式存储数据,不能像数组一样直接取值了,最终通过node方法实现,实现方式是二分法,遍历取值。

HashSet和LinkedHashSet

HashSet构造方法如下:

    public HashSet() {
        map = new HashMap<>();
    }

初始化了一个HashMap,也就是说,HashSet存储数据实际上使用了HashMap。

对数据的操作方法如下:

    private static final Object PRESENT = new Object();

    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

    public boolean remove(Object o) {
        return map.remove(o)==PRESENT;
    }

可以说是非常简单,全部调用了HashMap的方法,数据作为map的key,value统一为PRESENT。

再看一下LinkedHashSet:

public LinkedHashSet() {
        super(16, .75f, true);
    }

public LinkedHashSet(int initialCapacity) {
        super(initialCapacity, .75f, true);
    }
public LinkedHashSet(int initialCapacity, float loadFactor) {
        super(initialCapacity, loadFactor, true);
    }


HashSet(int initialCapacity, float loadFactor, boolean dummy) {
        map = new LinkedHashMap<>(initialCapacity, loadFactor);
    }

实际上LinkedHashSet创建的时候,调用了HashSet的构造方法,创建了一个指定初始容量(默认16)和负载因子(默认0.75)的LinkedHashMap。

其他方法全部都是调用父类HashSet,所以他们两个唯一的区别就是:HashSet是使用HashMap,而LinkedHashSet使用LinkedHashMap。

同样的,TreeSet数据存储使用的是TreeMap。而ArraySet则是Android提供的,和ArrayMap一样,都是采用了数组的形式存储数据,占用内存更小一些。

List 和 Set 的遍历以及数据操作

List 和 Set 都实现了Iteratorable接口,使用Iterator遍历方法如下:

        ArrayList<String> s = new ArrayList<>();
        s.add("a");
        s.add("b");
        s.add("c");
        s.add("d");
        s.add("e");
        Iterator<String> it = s.iterator();

        while (it.hasNext()){
            String s1 = it.next();
            System.out.println(s1);
        }

如果在遍历的过程中对数据进行操作,看下边的例子:

  Iterator<String> it = s.iterator();

    while (it.hasNext()){
        String s1 = it.next();
        if("a".equals(s1)){
            s.remove(s1);
        }
    }


    new Thread(new Runnable() {
            @Override
            public void run() {
                Iterator<String> it = s.iterator();
                while (it.hasNext()) {
                    String s1 = it.next();
                    System.out.println(s1);
                    try {
                        Thread.sleep(500);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                }
            }
        }).start();

        new Thread(new Runnable() {
            @Override
            public void run() {
                Iterator<String> it = s.iterator();
                while (it.hasNext()) {
                    String s1 = it.next();
                    if ("e".equals(s1)) {
                        it.remove();
                    }
                }
            }
        }).start();

运行以后会抛出下边的错误:

Exception in thread "main" java.util.ConcurrentModificationException

第一种情况是在使用Iterator的时候对集合进行操作,使用集合的remove或者add方法,第二种情况是在不同线程同时使用Iterator遍历,使用Iterator的remove方法,这两种情况都会抛出ConcurrentModificationException异常。

下面看ArrayList的源码:

    int expectedModCount = modCount;
    public Iterator<E> iterator() {
        return new Itr();
    }
    private class Itr implements Iterator<E> {
        public E next() {
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
            int i = cursor;
            if (i >= limit)
                throw new NoSuchElementException();
            Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length)
                throw new ConcurrentModificationException();
            cursor = i + 1;
            return (E) elementData[lastRet = i];
        }

        public void remove() {
            if (lastRet < 0)
                throw new IllegalStateException();
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();

            try {
                ArrayList.this.remove(lastRet);
                cursor = lastRet;
                lastRet = -1;
                expectedModCount = modCount;
                limit--;
            } catch (IndexOutOfBoundsException ex) {
                throw new ConcurrentModificationException();
            }
        }
     }

可以看到,每次使用next取值之前,都会检查modCountexpectedModCount是否相等,expectedModCount是Itr的成员变量,在创建Iterator对象时它的值就确定了,Itr类内部也不会对它进行操作,它的值时不变的,就是创建对象时的modCount,抛出异常说明modCount的值变了。再回头去看一下ArrayList的add,remove方法,就会发现,每次操作modCount的值都会改变,所以才导致异常。

如果是单线程中,可以使用Iterator的remove方法,可以看到,在remove方法删除元素之后,又对expectedModCount进行了复制,所以并不会报错。

如果是多线程,Iterator对象是不同的,一个对象调用remove之后,仅仅能保证本对象中的expectedModCount正确,其他线程中的Iterator对象是不会更新的,所以仍然会报错。多线程可以用concurrent包下的并发容器,

另外,数组实现的ArrayList,查找会比较快,但是数据量大的时候插入数据会比较慢,因为每次都要拷贝数据,而链表实现的LinkedList,查找时需要对链表进行遍历吗,所以会比较慢,而插入数据很快。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,258评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,335评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,225评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,126评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,140评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,098评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,018评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,857评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,298评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,518评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,678评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,400评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,993评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,638评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,801评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,661评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,558评论 2 352

推荐阅读更多精彩内容