集合
集合类存放于 Java.util 包中,主要有 3 种:set(集)、list(列表包含 Queue)和 map(映射)
从上面的集合框架图可以看到,Java 集合框架主要包括两种类型的容器,一种是集合(Collection),存储一个元素集合,另一种是图(Map),存储键/值对映射。Collection 接口又有 3 种子类型,List、Set 和 Queue,再下面是一些抽象类,最后是具体实现类,常用的有 ArrayList、LinkedList、HashSet、LinkedHashSet、HashMap、LinkedHashMap 等等。
List
List 是有序的 Collection。Java List 一共三个实现类: 分别是 ArrayList
、Vector
和 LinkedList.
ArrayList(数组)
- 有序,可重复
- 底层为数组
- 搜索速度快,增删慢
- 线程不安全
- 容量不足时,为 当前容量*1.5+1
Vector(数组实现、线程同步)
- 有序,可重复
- 底层为数组
- 搜索速度快,增删慢
- 线程安全,效率低(synchronized锁)
- 容量不足时,扩展一倍容量
LinkList(链表)
- 有序,可重复
- 底层为双向链表
- 搜索速度慢,增删块
- 线程不安全,效率低
并发下 ArrayList 不安全如何解决?
/**
* 解决方案;
* 1、List<String> list = new Vector<>();
* 2、List<String> list = Collections.synchronizedList(new ArrayList<>());
* 3、List<String> list = new CopyOnWriteArrayList<>();
* CopyOnWriteArrayList 使用的lock锁的机制
*/
Set
Set 注重独一无二的性质,该体系集合用于存储无序元素(存入和取出的顺序不一定相同),值不能重复。对象的相等性本质是对象 hashCode 值判断的,如果想要让两个不同的对象视为相等的,就必须覆盖 Object 的 hashCode 方法和 equals 方法。
HashSet
HashSet 存储元素的顺序是无序的,是按照哈希值来存的所以取数据也是按照哈希值取得。
HashSet 首先判断两个元素的哈希值,如果哈希值一样,接着会比较 equals 方法 如果 equls 结果为 true ,HashSet 就视为同一个元素。如果 equals 为 false 就不是 同一个元素
HashSet 通过 hashCode 值来确定元素在内存中的位置。一个 hashCode 位置上可以存放多个元素
HashSet 允许有 null 值。
HashSet 不是线程安全的
TreeSet
- 一个有序的集合,它的作用是提供有序的Set集合,支持add、remove、get等方法
- 比较此对象与指定对象的顺序。如果该对象小于、等于或大于指定对象,则分别返回负整 数、零或正整数
- 非线程安全的集合
LinkHashSet(HashSet+LinkedHashMap)
- 非线程安全的集合
并发下 Set不安全如何解决?
/**
* 同理可证 : ConcurrentModificationException
* //1、Set<String> set = Collections.synchronizedSet(new HashSet<>());
* //2、Set<String> set = new CopyOnWriteArraySet<>();
*/
Map
HashMap(数组+链表+红黑树)
- HashMap 最多只允许一条记录的键为 null,允许多条记 录的值为 null。
- HashMap 非线程安全
- 当链表中的元素超过了 8 个以后, 会将链表转换为红黑树,在这些位置进行查找的时候可以降低时间复杂度为 O(logN)。
HashTable(线程安全)
- 效率低使用synchronized锁住整个put方法
所有访问HashTable的线程都必须竞争同一把锁
ConcurrentHashMap(线程安全)
- 效率较高使用synchronized分段锁
数据分成一段一段地存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问。
TreeMap(可排序)
- 实现 SortedMap 接口,能够把它保存的记录根据键排序,默认是按键值的升序排序
LinkHashMap(记录插入顺序)
HashMap的工作原理(面试问题)
什么是HashMap?你为什么用到它?
HashMap可以接受null键值和值,而Hashtable则不能; HashMap是非synchronized; HashMap很快;
以及HashMap储存的是键值对
你知道HashMap的工作原理吗?
HashMap是基于hashing的原理,我们使用put(key,
value)存储对象到HashMap中,使用get(key)从HashMap中获取对象。
当我们给put()方法传递键和值时,我们先对键调用hashCode()方法,返回的hashCode用于找到bucket位置来储存Entry对象。
当两个对象的hashcode相同会发生什么?
因为hashcode相同,所以它们的bucket位置相同,‘碰撞’会发生。
因为HashMap使用链表存储对象,这个Entry(包含有键值对的Map.Entry对象)会存储在链表中。
如果两个键的hashcode相同,你如何获取值对象?
将会遍历链表直到找到值对象,找到bucket位置之后,会调用keys.equals()方法去找到链表中正确的节点,最终找到要找的值对象
如果HashMap的大小超过了负载因子(load factor)定义的容量,怎么办?
默认的负载因子大小为0.75,
也就是说,当一个map填满了75%的bucket时候,和其它集合类(如ArrayList等)一样,将会创建原来HashMap大小的两倍的bucket数组,来重新调整map的大小,并将原来的对象放入新的bucket数组中。
你了解重新调整HashMap大小存在什么问题吗?
在调整大小的过程中,存储在链表中的元素的次序会反过来,因为移动到新的bucket位置的时候,HashMap并不会将元素放在链表的尾部,而是放在头部