java集合与数据结构

这里尝试将java集合中的概念与数据结构中的概念相结合,以便更好的记忆。


集合框架体系图

概述:

  • Collection接口:集合类的基本接口,List、Set和Queue接口都继承自它。
  • Map接口:映射表的基础接口
  • Iterator接口:迭代器,可以通过迭代器遍历集合中的数据
集合框架接口图.png

此外,由上图可知,还有一个Iterable接口,它是Collection的父接口。
实现Iterable接口的类的对象可以成为 for-each 循环的目标,所以可以得出结论:对于标准类库中的任何集合都可以使用 “ for-each ”循环。
例如:

List<Object> list = new ArrayList();
for (Object obj: list){}

此外,数组也可以使用 for-each 循环遍历,如下:

Object[] list = new Object[10];
for (Object obj: list){}

下面开始详细介绍常用的几个集合:

List集合

java.util.List 接口继承自 Collection 接口,是单列集合的一个重要分支,习惯性地会将实现了 List 接口的对象称为List集合。在List集合中允许出现重复的元素,所有的元素是以一种线性方式进行存储的,在程序中可以通过索引来访问集合中的指定元素。另外,List集合还有一个特点就是元素有序,即元素的存入顺序和取出顺序一致。
这里容易想到List集合这个概念和数据结构中的线性表是很相似的。(List接口中的方法大多为抽象方法,这与线性表是逻辑结构对应。可以这样认为,List是带索引的线性表)
java List一共三个实现类:分别是ArrayList 、Vector 和 LinkedList。

ArrayList(对应于线性表的物理结构——数组)

ArrayList 是实现了List接口的可扩容数组(动态数组),它的内部是基于数组实现的。它的具体定义如下:

public class ArrayList<E> extends AbstractList<E> implements List<E>,
RandomAccess, Cloneable, java.io.Serializable {...}

总结:

  • ArrayList 是最常用的 List 实现类,底层数据结构是数组,查询快,增删慢。
  • ArrayList 不是线程安全的容器,如果多个线程中至少两个线程修改了 ArrayList 的结构的话就会导致线程安全问题,作为替代条件可以使用线程安全的 List ,应使用
    Collections.synchronizedList。
List list = Collections.synchronizedList(new ArrayList(...))

LinkedList(对应线性表中的物理结构——双向链表)

LinkedList 是一个双向链表,允许存储任何元素(包括null)。它主要特性如下:

  • LinkedList 底层数据结构是链表,查询慢,增删快。
  • LinkedList 也不是线程安全的,若多个线程并发访问链表,并且至少其中的一个线程修改了链表的结构,那么这个链表必须进行外部加锁。或者使用
List list = Collections.synchronizedList(new LinkedList(...))

Vector

Vector 同 ArrayList 一样,都是基于数组实现的,只不过 Vector 是一个线程安全的容器,它对内部的每个方法都简单粗暴的上锁,避免了多线程引起的安全性问题,但是通常这种同步方式需要的开销比较大。因此,访问元素的效率要远远低于 ArrayList 。
还有,ArrayList 扩容后数组长度会增加50%,而 Vector 扩容长度后数组会增加一倍。

Set集合

Set 注重独一无二的性质,该体系集合用于存储无序(存入和取出的顺序不一定相同)元素,值不能重复。对象的相等性本质是对象由 hashCode 值(java 是依据对象的内存地址计算出的此序号)判断的,如果想要让两个不同的对象视为相等的,就必须覆盖 Object 的 hashCode 方法和 equals 方法。

HashSet(对应的数据结构为Hash表)

哈希表边存放的是哈希值。HashSet 存储元素的顺序并不是按照存入时的顺序(和 List 显然不同)而是按照哈希值来存的所以取数据也是按照哈希值取得。元素的哈希值是通过元素的 hashcode 方法来获取的, HashSet 首先判断两个元素的哈希值,如果哈希值一样,接着会比较 equals 方法 如果 equls 结果为 true ,HashSet 就视为同一个元素。如果equals 为 false 就不是同一个元素。

哈希值相同 equals 为 false 的元素(即同义词)是如何存储呢,就是在同样的哈希值下顺延(可以认为哈希值相同的元素放在一个哈希桶中)。也就是哈希值一样的存一列。如图 1 表示 hashCode 值不相同的情况;图 2 表示 hashCode 值相同,但 equals 不相同的情况。


图1和图2.png

TreeSet(对应的数据结构为二叉树)

  • TreeSet()是使用二叉树(红黑树)的原理对新 add() 的对象按照指定的顺序排序(升序、降序),每增加一个对象都会进行排序,将对象插入的二叉树指定的位置。
  • Integer 和 String 对象都可以进行默认的 TreeSet 排序,而自定义类的对象是不可以的,自己定义的类必须实现Comparable 接口,并且覆写相应的 compareTo()函数,才可以正常使用。
  • 注意这个实现不是线程安全的。如果多线程并发访问 TreeSet ,并且至少一个线程修改了 TreeSet ,必须进行外部加锁。或者使用
SortedSet s = Collections.synchronizedSortedSet(new TreeSet(...))

LinkedHashSet

对于 LinkedHashSet 而言,它继承于 HashSet、又基于 LinkedHashMap 来实现的。LinkedHashSet 底层使用 LinkedHashMap 来保存所有元素,它继承与 HashSet,其所有的方法操作上又与 HashSet 相同,因此LinkedHashSet 的实现上非常简单,只提供了四个构造方法,并通过传递一个标识参数,调用父类的构造器,底层构造一个 LinkedHashMap 来实现,在相关操作上与父类 HashSet 的操作相同,直接调用父类 HashSet 的方法即可。

Map 接口

集是一个集合,它可以快速地查找现有的元素。但是,要查看一个元素, 需要有要查找元素的精确副本。这不是一种非常通用的査找方式。通常, 我们知道某些键的信息,并想要查找与之对应的元素。 映射(map) 数据结构就是为此设计的。映射用来存放键 / 值对。如果提供了键, 就能够查找到值。例如, 有一张关于员工信息的记录表, 键为员工 ID,值为 Employee 对象。

Java 类库为映射提供了两个通用的实现:HashMap 和 TreeMap。这两个类都实现了 Map 接口。

散列映射对键进行散列, 树映射用键的整体顺序对元素进行排序, 并将其组织成搜索树。散列或比较函数只能作用于键。与键关联的值不能进行散列或比较。

应该选择散列映射还是树映射呢? 与集一样, 散列稍微快一些, 如果不需要按照排列顺序访问键, 就最好选择散列。

HashMap

下列代码将为存储的员工信息建立一个散列映射:

Map<String, Employee>staff = new HashMap<>();
// HashMap implements Map
Employee harry = new Employee("Harry Hacker");
staff.put(”987-98-9996", harry);

每当往映射中添加对象时, 必须同时提供一个键。在这里,键是一个字符串,对应的值是 Employee 对象。
要想检索一个对象, 必须使用(因而,必须记住)一个键。

String id = "987-98-9996"; 
e = staff,get(id);// gets harry

如果在映射中没有与给定键对应的信息, get 将返回 null。

总结:

  • HashMap 是一个利用哈希表原理来存储元素的集合,并且允许空的 key-value 键值对。
  • HashMap 不是线程安全的,而 Hashtable 是线程安全的容器。
  • 可以使用 Collections.synchronizedMap(new HashMap(...)) 来构造一个线程安全的 HashMap。
  • 在java7中其底层是由数组+链表组成的,到了java8是由数组+链表+红黑树组成。

TreeMap

TreeMap 实现 SortedMap 接口,能够把它保存的记录根据键排序,默认是按键值的升序排序,也可以指定排序的比较器(通过 Comparator 进行定制排序),当用 Iterator 遍历 TreeMap 时,得到的记录是排过序的。

如果使用排序的映射,建议使用 TreeMap。

在使用 TreeMap 时,key 必须实现Comparable 接口或者在构造 TreeMap 传入自定义的 Comparator,否则会在运行时抛出 java.lang.ClassCastException 类型的异常。

LinkedHashMap(记录插入顺序)

LinkedHashMap 是 HashMap 的一个子类,保存了记录的插入顺序,在用 Iterator 遍历LinkedHashMap 时,先得到的记录肯定是先插入的,也可以在构造时带参数,按照访问次序排序。


Collections 类

java.utils.Collections 是集合工具类,用来对集合进行操作。部分方法如下:

  • public static <T> boolean addAll(Collection<T> c, T... elements) :往集合中添加一些元素。
  • public static void shuffle(List<?> list) 打乱顺序 :打乱集合顺序。
  • public static <T> void sort(List<T> list) :将集合中元素按照默认规则排序。
  • public static <T> void sort(List<T> list,Comparator<? super T> ) :将集合中元素按照指定规则排序。

代码演示

public class CollectionsDemo { 
  public static void main(String[] args) {             
    ArrayList<Integer> list = new ArrayList<Integer>(); 
    //原来写法 
    //list.add(12); 
    //list.add(14); 
    //list.add(15); 
    //list.add(1000); 
    //采用工具类完成往集合中添加元素     
    Collections.addAll(list, 5, 222, 1,2); 
    System.out.println(list); 
    //排序方法 
    Collections.sort(list); 
    System.out.println(list); 
  } 
}
结果: 
[5, 222, 1, 2] 
[1, 2, 5, 222]

代码演示之后 ,发现我们的集合按照顺序进行了排列,可是这样的顺序是采用默认的顺序,如果想要指定顺序那该 怎么办呢?

我们发现还有个方法没有讲, public static <T> void sort(List<T> list,Comparator<? super T> ) :将集合中 元素按照指定规则排序。接下来讲解一下指定规则的排列。

Comparator比较器

在JAVA中提供了两种比较大小的方式,一种是比较死板的 采用 java.lang.Comparable 接口去实现,一种是灵活的当我需要做排序的时候再去选择的 java.util.Comparator 接口来完成。

那么我们采用的 public static <T> void sort(List<T> list) 这个方法完成的排序,实际上要求了被排序的类型 需要实现Comparable接口完成比较的功能,在String类型上如下:

public final class String implements java.io.Serializable, Comparable<String>, CharSequence {

String类实现了这个接口,并完成了比较规则的定义,但是这样就把这种规则写死了,那比如我想要字符串按照第 一个字符降序排列,那么这样就要修改String的源代码,这是不可能的了,那么这个时候我们可以使用 public static <T> void sort(List<T> list,Comparator<? super T> ) 方法灵活的完成,这个里面就涉及到了 Comparator 这个接口,位于位于java.util包下,排序是comparator能实现的功能之一,该接口代表一个比较器,比较器具有可比性!顾名思义就是做排序的,通俗地讲需要比较两个对象谁排在前谁排在后,那么比较的方法就是:

  • public int compare(String o1, String o2) :比较其两个参数的顺序。

两个对象比较的结果有三种:大于,等于,小于。
如果要按照升序排序, 则o1 小于o2,返回(负数),相等返回0,01大于02返回(正数) 如果要按照 降序排序 则o1 小于o2,返回(正数),相等返回0,01大于02返回(负数)

操作如下:

public class CollectionsDemo3 { 
  public static void main(String[] args) { 
    ArrayList<String> list = new ArrayList<String>();                 
    list.add("cba"); 
    list.add("aba"); 
    list.add("sba");
    list.add("nba"); 
    //排序方法 按照第一个单词的降序 
    Collections.sort(list, new Comparator<String>() {
      @Override 
      public int compare(String o1, String o2) { 
          return o2.charAt(0) ‐ o1.charAt(0); 
      } 
  }); 
  System.out.println(list); 
  } 
}

结果如下:

[sba, nba, cba, aba]


集合实现类特征图


集合实现类特征图.png
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容