集合类的介绍

一、JAVA中的集合分类

Collection
├List
│├LinkedList
│├ArrayList
│└Vector
│　└Stack
└Set
Map
├HashTable
├HashMap
└WeakHashMap

Collection 和 Map 的区别
Collection类型者，每个位置只有一个元素。
Map类型者，持有 key-value pair，像个小型数据库。

要注意：Collection、List、Set、Map都是接口，不能实例化。继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class，这些才可被实例化。

二、Collection接口

Collection是最基本的集合接口，声明了适用于JAVA集合(只包括Set和List)的通用方法。
Collection接口的方法：

boolean add(Object o)    ：向集合中加入一个对象的引用 
void clear()             ：删除集合中所有的对象，即不再持有这些对象的引用   
boolean remove(Object o) ：从集合中删除一个对象的引用 
boolean isEmpty()        ：判断集合是否为空 
boolean contains(Object o) ：判断集合中是否持有特定对象的引用   
Iterartor iterator()       ：返回一个Iterator对象，可以用来遍历集合中的元素 
int size()                 ：返回集合中元素的数目
Object[] toArray()         ：返回一个数组，该数组中包括集合中的所有元素

注意：Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素！

1. Set(集合)

Set是最简单的一种集合，存放的是对象的引用。集合中的对象不按特定的方式排序，没有重复的对象。Set接口主要有三个实现类：

HashSet：HashSet类按照哈希算法来存取集合中的对象，存取速度较快，存入HashSet的对象必须定义hashCode()。
TreeSet：TreeSet类底层为树结构，对象以升序顺序存储，访问和遍历的时间很快。
LinkedHashSet：具有HashSet的查询速度，且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时，结果会按元素插入的次序显示。

Set具有与Collection完全一样的接口，因此没有任何额外的功能，实际上Set就是Collection，只是行为不同。
Set的add()方法是如何判断是否有重复的对象在集合中的呢？由以下代码实现

boolean isExists=false;  
Iterator iterator=set.iterator();  
    while(it.hasNext()){  
        String oldStr=it.next();  
        if(newStr.equals(oldStr)){  
               isExists=true;   
       }  
}

2. List(链表)

List是有序的Collection，集合中可以存放重复的对象。List接口主要有两个实现类：

ArrayList：代表长度可以改变的数组，可以对元素进行随机访问，插入和删除元素慢(数组的特征)。
LinkedList：采用链表的数据结构实现，插入和删除速度快，访问速度慢(链表的特征)。

要注意，因为List是一接口，所以不能被构造，只能创建一个引用：

List list;     //正确，list=null
List list = new ArrayList();  //正确
List list = new List();   //错误的用法

同时也要注意下面两种用法：

//下面这句程序创建了一个ArrayList对象后上溯到了List对象，此时它是一个List对象
//因此有些ArrayList有但是List没有的属性和方法，它就不能再用了。
List list = new ArrayList();  
//下面这句程序创建的对象则保留了ArrayList的所有属性。 
ArrayList list = new ArrayList();

使用ArrayList list = new ArrayList(); 的问题就在于List有多个实现类，现在你用的是ArrayList，也许哪一天你需要换成其它的实现类，如 LinkedList或者Vector等等，这时你只要改变这一行就行了：List list = new LinkedList()，其它使用了list地方的代码根本不需要改动。假设你开始用 ArrayList alist = new ArrayList()，这下你有的改了，特别是如果你使用了 ArrayList特有的方法和属性。
List为Collection添加了许多方法，使得能够向List中间插入与移除元素(这只推荐LinkedList使用)，同时也提供了一些方法让我们可以对List中的元素进行随机访问。
List的get(int index) 方法放回集合中由参数index指定的索引位置的对象，下标从“0”开始。下面展示最基本的两种检索集合中的所有对象的方法：

//for循环和get()方法
for(int i=0; i<list.size();i++){  
    System.out.println(list.get(i));  
}  

// 使用 迭代器（Iterator）
Iterator it=list.iterator();  
while(it.hashNext()){   
    System.out.println(it.next());  
}

LinkList提供了一些功能方法，这些方法 (没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用：

addFirst()
addLast()
getFirst()
getLast()
removeFirst()
removeLast()
ListIterator  listIterator() ：和标准的Iterator接口比拟，ListIterator可以向List中添加对象，还可以实现逆向（顺序向前）遍历，这些都是Iterator没有的

对于随机访问get和set，ArrayList优于LinkedList，因为LinkedList要移动指针
对于新增和删除操作add和remove，LinedList比较占优势，因为ArrayList要移动数据。
查找操作indexOf，lastIndexOf，contains等，两者差不多。

三、Map接口

Map是一种把键对象和值对象映射的集合，它的每一个元素都包含一对键对象和值对象。Map中不允许有重复的键值。Map接口主要有两个实现类：

1.HashMap
HashMap的数据结构和哈希表相同。下面看一下HashMap的存储：

int hash=key.hashCode(); //获取key的hashCode，这个值是一个固定的int值
int index=hash%Entry[].length; //获取数组下标：key的hash值对Entry数组长度进行取余
Entry[index]=value;

HashMap会先用key的hash值来检查是否发生了hash碰撞，也就是对应的位置是否为空，这个没问题。问题是当发生了hash碰撞时，就会比较该位置上存储的每一个key是否与新存入的相等，如果相等就替换之，否则就在该位置增加一个值。很明显，你代码中的前后两个key是相同的，所以后面的会替换掉前面的。
此外介绍一下LinkedHashMap。我们都知道HashMap是无序的，HashMap在put时是根据 key 的 hashcode 进行 hash 然后放入对应的地方。所以在按照一定顺序 put 进 HashMap 中，然后遍历出 HashMap 的顺序跟 put 的顺序不同（除非在 put 的时候 key 已经按照 hashcode 排序号了，这种几率非常小）。JAVA 在 JDK1.4 以后提供了 LinkedHashMap来帮助我们实现了有序的 HashMap：LinkedHashMap 是HashMap的一个子类，它保留插入的顺序，如果需要输出的顺序和输入时的相同，那么就选用 LinkedHashMap。我们来通过一个例子看看如何实现LinkedHashMap。

public static void main(String[] args) {
    ap<String, String> map = new LinkedHashMap<String, String>();
    map.put("apple", "苹果");
    map.put("watermelon", "西瓜");
    map.put("banana", "香蕉");
    map.put("peach", "桃子");

    map.get("banana");
    map.get("apple");

    Iterator iter = map.entrySet().iterator();
    while (iter.hasNext()) {
        Map.Entry entry = (Map.Entry) iter.next();
        System.out.println(entry.getKey() + "=" + entry.getValue());
    }
}

看一下控制台的输出：

apple=苹果
watermelon=西瓜
banana=香蕉
peach=桃子

2.HashTable
HashTable几乎可以等价于HashMap，但是HashMap是非synchronized，而Hashtable是synchronized，这意味着Hashtable是线程安全的，多个线程可以共享一个Hashtable；而如果没有正确的同步的话，多个线程是不能共享HashMap的。 sychronized意味着在一次仅有一个线程能够更改Hashtable。就是说任何线程要更新Hashtable时要首先获得同步锁。

Map常用方法

【Map常用方法】

Object get(Object key) ：返回与给定“键”相关联的“值”
Object put(Object key, Object value)： 向集合中加入元素   
Object remove(Object key)： 删除与KEY相关的元素   
void clear()：从映像中删除所有映射

【遍历Map的两种方法】
keySet()：keySet是键的集合，Set里面的类型即key的类型。
entrySet()：entrySet是键-值对的集合，Set里面的类型是Map.Entry。

//keySet
Map map=new HashMap();
Iterator it=map.keySet().iterator();
Object key;
Object value;
while(it.hasNext()){
     key=it.next();
     value=map.get(key);
     System.out.println(key+":"+value);
}

//entrySet()
Map map=new HashMap();
Iterator it=map.entrySet().iterator();
Object key;
Object value;
while(it.hasNext()){
     Map.Entry entry = (Map.Entry)it.next();
     key=entry.getKey();
     value=entry.getValue();
     System.out.println(key+"="+value);
}

四、数组和集合的比较

世间上本来没有集合，有人想要，所以有了集合。有人想有可以自动扩展的数组,所以有了List ；有的人想有没有重复的数组,所以有了set；有人想有自动排序的组数,所以有了TreeSet、TreeList、Tree** ....。
几乎所有的集合都是基于数组来实现的。因为集合是对数组做的封装，所以数组永远比任何一个集合要快，但任何一个集合，比数组提供的功能要多。

数组与集合的对比：
1.数组要声明了它容纳的元素的类型，并且同一个数组织能存放类型一样的数据；而集合元素类型是object，即不用声明元素类型。
2.一个数组实例具有固定的大小，不能伸缩；集合则可根据需要动态改变大小。
3.数组要有整数下标才能访问特定的元素。集合也是数据列表却不使用下标访问。
4.数组是一种可读/可写数据结构，没有办法创建一个只读数组。然而集合可以提供ReadOnly方法，以只读方式来使用集合。

Java中有一个Arrays类，专门用来操作array，但是Array还有一个缺点是，无法判断其中实际存有多少元素，length只是告诉我们array的容量。
如果我们想将一个数组转化为一个List对象，可以使用Arrays.asList()，这个方法会返回一个ArrayList类型的对象，这个ArrayList并不是java.util.ArrayList，它是一个Arrays类中的重新定义的内部类！这个生成的List，它是固定长度的，如果对其进行add或者remove的操作，会抛出UnsupportedOperationException。我们来看看这个ArrayList的实现：

 private static class ArrayList<E> extends AbstractList<E>
    implements RandomAccess, java.io.Serializable
    {
        private static final long serialVersionUID = -2764017481108945198L;
    private Object[] a;
    ArrayList(E[] array) {
            if (array==null)
                throw new NullPointerException();
        a = array;
    }
    public int size() {
        return a.length;
    }
    public Object[] toArray() {
        return (Object[])a.clone();
    }
    public E get(int index) {
        return (E)a[index];
    }
    public E set(int index, E element) {
        Object oldValue = a[index];
        a[index] = element;
        return (E)oldValue;
    }
        public int indexOf(Object o) {
            if (o==null) {
                for (int i=0; i<a.length; i++)
                    if (a[i]==null)
                        return i;
            } else {
                for (int i=0; i<a.length; i++)
                    if (o.equals(a[i]))
                        return i;
            }
            return -1;
        }
        public boolean contains(Object o) {
            return indexOf(o) != -1;
        }
    }

在这里，传递基本类型数组时强烈建议转为其封装类对象的数组 int ->Integer ,long->Long ，不然不管数组里面有多少个元素，使用Arrays.asList(array).size()得出来的结果都为1。

五、迭代器

Iterator接口声明了如下方法：

hasNext()：判断集合中元素是否遍历完毕，如果没有，就返回true  
next()   ：返回下一个元素  
remove() ：从集合中删除上一个有next()方法返回的元素。

而上面我们讲到的LinkList中的ListIterator迭代器包含的方法有：

add(E e): 将指定的元素插入列表，插入位置为迭代器当前位置之前
hasNext()：以正向遍历列表时，如果列表迭代器后面还有元素，则返回 true，否则返回false
hasPrevious():如果以逆向遍历列表，列表迭代器前面还有元素，则返回 true，否则返回false
next()：返回列表中ListIterator指向位置后面的元素
nextIndex():返回列表中ListIterator所需位置后面元素的索引
previous():返回列表中ListIterator指向位置前面的元素
previousIndex()：返回列表中ListIterator所需位置前面元素的索引
remove():从列表中删除next()或previous()返回的最后一个元素（有点拗口，意思就是对迭代器使用hasNext()方法时，删除ListIterator指向位置后面的元素；当对迭代器使用hasPrevious()方法时，删除ListIterator指向位置前面的元素）
set(E e)：从列表中将next()或previous()返回的最后一个元素返回的最后一个元素更改为指定元素e

六、集合中的数据结构

(1)哈希表
详情可以看我写的哈希详解，具体的将不再描述。
(2)链表

集合类的介绍