Set集合

Set集合最大的特点就是不允许保存重复元素，其也是Collection子接口。

Set接口简介

在JDK1.9以前Set集合与Collection集合的定义并无差别，Set继续使用了Collection接口中提供的方法进行操作，但是从JDK1.9后，Set集合也像List集合一样扩充了一些static方法，Set集合的定义如下：

public interface Set<E> extends Collection<E>

需要注意的是Set集合并不像List集合那样扩充了许多的新方法，所以无法使用List集合中提供的get()方法，也就是说无法实现指定索引数据的获取，Set接口的继承关系如下。

Set接口

从JDK1.9后，Set集合也提供了像List集合中类似的of()的静态方法。下面就使用此方法进行Set集合特点的验证。
范例：验证集合特征

import  java.util.Set;
public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
        //进行Set集合数据的保存，并设置有重复的内容
       Set<String> all=Set.of("Hello","World","MLDN","Hello","World");
       all.forEach(System.out::println);
       //Exception in thread "main" java.lang.IllegalArgumentException: duplicate element: Hello
    }
}

当使用of()这个新方法时如果发现集合中存在重复元素则会直接抛出异常。这与传统的Set集合不保存重复元素的特点相一致，只不过这个方法抛出了异常。

Set集合的常规使用形式一定是依靠子类进行实例化的，所以Set接口之中有两个常用的子类：HashSet、TreeSet。

HashSet子类

HashSet是Set接口中使用最多的一个子类，其最大的特点就是保存的数据时无序的，而HashSet类的定义：

public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, Serializable

这种继承的形式和之前的ArrayList是非常相似的，那么现在来观察一下类的继承结构：

HashSet

范例：观察HashSet类

import java.util.HashSet;
import  java.util.Set;
public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
       Set<String> all=new HashSet();
       all.add("Hello");
       all.add("World");
       all.add("MLDN");
       all.add("Hello");
       all.add("World");
       all.add("baidu");
       all.forEach(System.out::println);
        /**
         * Hello
         * baidu
         * World
         * MLDN
         */
    }
}

通过执行结构就可以发现HashSet的操作特点：不允许保存重复元素（Set接口定义的），另外一个特点就是HashSet中保存的数据时无序的。

TreeSet子类

Set的另外一个子接口就是TreeSet，与HashSet最大区别在于TreeSet集合中保存的数据时有序的，首先来观察TreeSet的定义：

public class TreeSet<E> extends AbstractSet<E> implements NavigableSet<E>, Cloneable, Serializable

public interface NavigableSet<E> extends SortedSet<E>

public interface SortedSet<E> extends Set<E>

在这个子类中依然继承了AbstractSet父抽象类，同时又实现了一个NavigableSet父接口。

TreeSet

范例：使用TreeSet

import java.util.Set;
import java.util.TreeSet;
public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
       Set<String> all=new TreeSet();
       all.add("Hello");
       all.add("World");
       all.add("MLDN");
       all.add("Hello");
       all.add("World");
       all.add("baidu");
       all.forEach(System.out::println);
        /**按照字母顺序排序
         * Hello
         * MLDN
         * World
         * baidu
         */
    }
}

当利用TreeSet保存的数据时，所有的数据将按照数据的升序进行自动排序处理。

TreeSet排序说明

经过分析后发现，TreeSet类中保存的数据时允许排序的，但是这个类必须要实现Comparable接口，只有实现了此接口才能够确认出对象的大小关系。

TreeSet本质上是利用TreeMap类实现的集合数据的存储，而TreeMap（树）就需要根据Comparable来确定对象的大小关系。

范例：使用自定义的类实现排序的处理操作

import java.util.Set;
import java.util.TreeSet;
public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
        Set<Person> all=new TreeSet();
        all.add(new Person("张三",19));
        all.add(new Person("李四",21));
        all.add(new Person("王五",20));
        all.add(new Person("李四",21));//数据重复
        all.add(new Person("赵六",19));//年龄相同，但姓名不同
        all.add(new Person("张三",22));//年龄不同，但姓名相同
        all.forEach(System.out::println);
        /**
         * 姓名、张三、年龄：19
         * 姓名、赵六、年龄：19
         * 姓名、王五、年龄：20
         * 姓名、李四、年龄：21
         * 姓名、张三、年龄：22
         */
    }
}
@lombok.AllArgsConstructor//自动生成全部参数的构造方法
class Person implements Comparable<Person>{
    private String name;
    private int age;
    @Override
    public String toString() {
        return String.format("姓名、%s、年龄：%s", name, age);
    }
    @Override
    public int compareTo(Person o) {
        if(age!=o.age){
            return age-o.age;
        }
        return name.compareTo(o.name);
    }
}

在使用自定义类对象进行比较处时，一定要将该类中所有属性都依次进行大小关系的匹配，否则某一个或者几个属性相同时也会被默认认为是重复数据，所以TreeSet是利用了Comparable接口来确认重复数据的。

由于TreeSet在操作过程之中需要将类中的所有属性进行比对，这样的实现过于繁琐，那么在实际的开发中应该首选HashSet子类进行存储。

关于重复元素的说明

TreeSet类是利用了Comparable接口来实现了重复元素的判断，但是Set集合的整体特征就是不允许保存重复元素。但是HashSet判断重复元素的方式并不是利用Comparable接口完成的，它利用的是Object类中提供的方法实现的：

对象编码：public int hashCode()；
对象比较：public boolean equals(Object obj)；

在进行重复元素判断时首先利用hashCode()进行编码的匹配，如果该编码不存在，则表示数据不存在，证明没有重复，如果该编码存在，则进一步进行对象比较处理，如果相同，则此数据是不允许保存的。

范例：实现重复元素处理

@lombok.AllArgsConstructor//自动生成全部参数的构造方法
@lombok.Data//会自动生成getter、setter、hashCode、equals、toString等方法
class Person{
    private String name;
    private int age;
}

在Java程序中，真正的重复元素的判断处理利用的就是hashCode和equals()两个方法共同作用完成的，而只有在排序要求的情况下（TreeSet）才会利用Comparable接口来实现。