在日常的数据分析工作中,常常需要使用到集合来存储和处理数据,因此需要对集合的分类和功能有所了解。Java的集合框架分为两部分,分别对应两大接口:Collection接口和Map接口。以下就通过这两大接口开始讲解。这篇文章主要讲Collection接口。
接口
先说说接口是什么,接口(英文:Interface),在JAVA编程语言中是一个抽象类型,是抽象方法的集合,接口通常以interface来声明。一个类通过继承接口的方式,从而来继承接口的抽象方法。
1、接口的声明
/* 文件名 : Animal.java */
interface Animal {
public void eat();
public void travel();
}
2、接口的实现
当类实现接口的时候,类要实现接口中所有的方法。否则,类必须声明为抽象的类。类使用implements关键字实现接口。
/* 文件名 : MammalInt.java */
public class MammalInt implements Animal{
public void eat(){
System.out.println("Mammal eats");
}
public void travel(){
System.out.println("Mammal travels");
}
public int noOfLegs(){
return 0;
}
public static void main(String args[]){
MammalInt m = new MammalInt();
m.eat();
m.travel();
}
}
collection接口涉及三种类型的集合:1.Set(规则集) 2.List(线性表) 3.Queue(队列)
1、List接口
List的主要特征:
(1)有序(ordered):元素的存取是有序的,保证了取出的元素的顺序与输入的元素顺序保持一致。
(2)索引(index):允许用户根据索引对元素进行精准定位并进行查询、插入、删除等操作。
(3)允许重复:允许多个重复的元素存在。
import java.util.*;
public class CollectionDemo {
public static void main(String[] args) {
// ArrayList
ArrayList<String> list = new ArrayList<String>(); // 父类接口List引用ArrayList
list.add("Hello");
list.add("World");
list.add("HAHAHAHA");
// 第一种遍历方法使用 For-Each 遍历 List
for (String str : list) { // 也可以改写 for(int i=0;i<list.size();i++) 这种形式
System.out.println(str);
}
// 第二种遍历,把链表变为数组相关的内容进行遍历
// 创建数组:dataType[] arrayRefVar = new dataType[arraySize];
String[] strArray = new String[list.size()];
list.toArray(strArray);
for (int i = 0; i < strArray.length; i++) { // 这里也可以改写为 for(String str:strArray) 这种形式
System.out.println(strArray[i]);
}
// 第三种遍历 使用迭代器进行相关遍历,该方法可以不用担心在遍历的过程中会超出集合的长度
Iterator<String> ite = list.iterator();
while (ite.hasNext()) { // 判断下一个元素之后有值
System.out.println(ite.next());
}
// LinkedList
LinkedList<String> list2 = new LinkedList<String>();
list2.add("11");
list2.add("22");
list2.add("33");
for (String str : list2) {
System.out.println(str);
}
// Vector
Vector<String> list3 = new Vector<String>();
list3.add("111");
list3.add("222");
list3.add("333");
for (String str : list3) {
System.out.println(str);
}
}
}
2、Set接口
Set的主要特征
(1)不允许重复:元素不允许重复。Set在存储元素时会通过hashCode()和equals()来保证元素的唯一性。
Set如何保证元素的唯一性:
Set在存储元素时,通过hashCode()和equals()来保证元素的唯一性。
事实上,当存储一个新的元素时,仅仅通过equals()来逐一判断新元素是否与集合中已有的元素是否重合,这种方法也是可行的,那为什么还需要hashCode()呢。因为当Set中元素数量很多时,通过equals()逐一判断并不是一个高效率的方法,所以同时通过hashCode()和equals()进行判断可以提高判断的效率。
hashCode()是Object的类,每个对象都具有hashCode值。不同的对象可能会有相同的hashCode值,但hashCode值不相同的两个对象肯定不同。
我们可以用映射的概念来理解对象与hashCode之间的关系,对象(value)与hashCode(key)构成了多对一的映射。
当每次存储新的元素时,首先通过hashCode()获得新元素的hashCode,判断是否与已有元素的hashCode相同。如果没有,将新元素加入到集合中。如果有,再通过equals()判断元素是否相同,如果相同,则不添加该元素,如果不同,则把该元素加到集合中。
2.1 HashSet
HashSet元素存储的结构是哈希表。
hashSet除了不允许重复元素外,还不能保证元素存取的顺序。
import java.util.*;
public class setDemo1 {
public static void main(String[] args) {
HashSet<String> hash = new HashSet<String>();
hash.add("11");
hash.add("22");
hash.add("33");
Iterator<String> it = hash.iterator();
while (it.hasNext()) {
System.out.print(it.next() + " "); // 每次输出的顺序都不一样
}
}
}
2.2 LinkedHashSet
LinkedHashSet的元素的存储结构是链表和哈希表。
LinkedHashSet保证了元素存取的顺序。
LinkedHashSet遵循先进先出的顺序
import java.util.*;
public class setDemo2 {
public static void main(String[] args) {
LinkedHashSet<String> lset = new LinkedHashSet<String>();
lset.add("11");
lset.add("22");
lset.add("33");
Iterator<String> it = lset.iterator();
while (it.hasNext()) {
System.out.print(it.next() + " ");
}
}
}
TreeSet可以保证元素存取的顺序