Set集合最大的特点就是不允许保存重复元素,其也是Collection子接口。
Set接口简介
在JDK1.9以前Set集合与Collection集合的定义并无差别,Set继续使用了Collection接口中提供的方法进行操作,但是从JDK1.9后,Set集合也像List集合一样扩充了一些static方法,Set集合的定义如下:
public interface Set<E> extends Collection<E>
需要注意的是Set集合并不像List集合那样扩充了许多的新方法,所以无法使用List集合中提供的get()方法,也就是说无法实现指定索引数据的获取,Set接口的继承关系如下。
从JDK1.9后,Set集合也提供了像List集合中类似的of()的静态方法。下面就使用此方法进行Set集合特点的验证。
范例:验证集合特征
import java.util.Set;
public class JavaAPIDemo {
public static void main(String[] args) throws Exception {
//进行Set集合数据的保存,并设置有重复的内容
Set<String> all=Set.of("Hello","World","MLDN","Hello","World");
all.forEach(System.out::println);
//Exception in thread "main" java.lang.IllegalArgumentException: duplicate element: Hello
}
}
当使用of()这个新方法时如果发现集合中存在重复元素则会直接抛出异常。这与传统的Set集合不保存重复元素的特点相一致,只不过这个方法抛出了异常。
Set集合的常规使用形式一定是依靠子类进行实例化的,所以Set接口之中有两个常用的子类:HashSet、TreeSet。
HashSet子类
HashSet是Set接口中使用最多的一个子类,其最大的特点就是保存的数据时无序的,而HashSet类的定义:
public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, Serializable
这种继承的形式和之前的ArrayList是非常相似的,那么现在来观察一下类的继承结构:
范例:观察HashSet类
import java.util.HashSet;
import java.util.Set;
public class JavaAPIDemo {
public static void main(String[] args) throws Exception {
Set<String> all=new HashSet();
all.add("Hello");
all.add("World");
all.add("MLDN");
all.add("Hello");
all.add("World");
all.add("baidu");
all.forEach(System.out::println);
/**
* Hello
* baidu
* World
* MLDN
*/
}
}
通过执行结构就可以发现HashSet的操作特点:不允许保存重复元素(Set接口定义的),另外一个特点就是HashSet中保存的数据时无序的。
TreeSet子类
Set的另外一个子接口就是TreeSet,与HashSet最大区别在于TreeSet集合中保存的数据时有序的,首先来观察TreeSet的定义:
public class TreeSet<E> extends AbstractSet<E> implements NavigableSet<E>, Cloneable, Serializable
public interface NavigableSet<E> extends SortedSet<E>
public interface SortedSet<E> extends Set<E>
在这个子类中依然继承了AbstractSet父抽象类,同时又实现了一个NavigableSet父接口。
范例:使用TreeSet
import java.util.Set;
import java.util.TreeSet;
public class JavaAPIDemo {
public static void main(String[] args) throws Exception {
Set<String> all=new TreeSet();
all.add("Hello");
all.add("World");
all.add("MLDN");
all.add("Hello");
all.add("World");
all.add("baidu");
all.forEach(System.out::println);
/**按照字母顺序排序
* Hello
* MLDN
* World
* baidu
*/
}
}
当利用TreeSet保存的数据时,所有的数据将按照数据的升序进行自动排序处理。
TreeSet排序说明
经过分析后发现,TreeSet类中保存的数据时允许排序的,但是这个类必须要实现Comparable接口,只有实现了此接口才能够确认出对象的大小关系。
TreeSet本质上是利用TreeMap类实现的集合数据的存储,而TreeMap(树)就需要根据Comparable来确定对象的大小关系。
范例:使用自定义的类实现排序的处理操作
import java.util.Set;
import java.util.TreeSet;
public class JavaAPIDemo {
public static void main(String[] args) throws Exception {
Set<Person> all=new TreeSet();
all.add(new Person("张三",19));
all.add(new Person("李四",21));
all.add(new Person("王五",20));
all.add(new Person("李四",21));//数据重复
all.add(new Person("赵六",19));//年龄相同,但姓名不同
all.add(new Person("张三",22));//年龄不同,但姓名相同
all.forEach(System.out::println);
/**
* 姓名、张三、年龄:19
* 姓名、赵六、年龄:19
* 姓名、王五、年龄:20
* 姓名、李四、年龄:21
* 姓名、张三、年龄:22
*/
}
}
@lombok.AllArgsConstructor//自动生成全部参数的构造方法
class Person implements Comparable<Person>{
private String name;
private int age;
@Override
public String toString() {
return String.format("姓名、%s、年龄:%s", name, age);
}
@Override
public int compareTo(Person o) {
if(age!=o.age){
return age-o.age;
}
return name.compareTo(o.name);
}
}
在使用自定义类对象进行比较处时,一定要将该类中所有属性都依次进行大小关系的匹配,否则某一个或者几个属性相同时也会被默认认为是重复数据,所以TreeSet是利用了Comparable接口来确认重复数据的。
由于TreeSet在操作过程之中需要将类中的所有属性进行比对,这样的实现过于繁琐,那么在实际的开发中应该首选HashSet子类进行存储。
关于重复元素的说明
TreeSet类是利用了Comparable接口来实现了重复元素的判断,但是Set集合的整体特征就是不允许保存重复元素。但是HashSet判断重复元素的方式并不是利用Comparable接口完成的,它利用的是Object类中提供的方法实现的:
- 对象编码:public int hashCode();
- 对象比较:public boolean equals(Object obj);
在进行重复元素判断时首先利用hashCode()进行编码的匹配,如果该编码不存在,则表示数据不存在,证明没有重复,如果该编码存在,则进一步进行对象比较处理,如果相同,则此数据是不允许保存的。
范例:实现重复元素处理
@lombok.AllArgsConstructor//自动生成全部参数的构造方法
@lombok.Data//会自动生成getter、setter、hashCode、equals、toString等方法
class Person{
private String name;
private int age;
}
在Java程序中,真正的重复元素的判断处理利用的就是hashCode和equals()两个方法共同作用完成的,而只有在排序要求的情况下(TreeSet)才会利用Comparable接口来实现。