更多 Java 集合类方面的文章,请参见文集《Java 集合类》
摘要: 阿里巴巴集团推出的《阿里巴巴Java开发手册(正式版)》是阿里巴巴近万名开发同学集体智慧的结晶,以开发视角为中心,详细列举如何开发更加高效、更加容错、更加有协作性,力求知其然,更知其不然,结合正反例,让Java开发者能够提升协作效率、提高代码质量。
作为一个 Java 开发人员,我花了一天时间阅读了这个开发手册,摘要了一些对于我有用的知识点。记录如下,仅供参考。
集合处理
- 关于
hashCode
和equals
的处理,遵循如下规则:
1) 只要重写equals
,就必须重写hashCode
。
2) 因为Set
存储的是不重复的对象,依据hashCode
和equals
进行判断,所以Set
存储的对象必须重写这两个方法。
3) 如果自定义对象做为Map
的键,那么必须重写hashCode
和equals
。
正例:String
重写了hashCode
和equals
方法,所以我们可以非常愉快地使用String
对象作为 key 来使用。
-
ArrayList
的subList
结果不可强转成ArrayList
,否则会抛出ClassCastException
异常。
说明:subList
返回的是ArrayList
的内部类SubList
,并不是ArrayList
,而是ArrayList
的一个视图,对于SubList
子列表的所有操作最终会反映到原列表上。 - 在
subList
场景中,高度注意对原集合元素个数的修改,会导致子列表的遍历、增加、删除均产生ConcurrentModificationException
异常。 - 使用集合转数组的方法,必须使用集合的
toArray(T[] array)
,传入的是类型完全一样的数组,大小就是list.size()
。
反例:直接使用toArray
无参方法存在问题,此方法返回值只能是Object[]
类,若强转其它类型数组将出现ClassCastException
错误。
正例:
List<String> list = new ArrayList<String>(2);
list.add("guan");
list.add("bao");
String[] array = new String[list.size()];
array = list.toArray(array);
说明:使用 toArray
带参方法,入参分配的数组空间不够大时,toArray
方法内部将重新分配内存空间,并返回新数组地址;如果数组元素大于实际所需,下标为 [ list.size() ]
的数组元素将被置为 null
,其它数组元素保持原值,因此最好将方法入参数组大小定义与集合元素个数一致。
- 使用工具类
Arrays.asList()
把数组转换成集合时,不能使用其修改集合相关的方法,它的add/remove/clear
方法会抛出UnsupportedOperationException
异常。
说明:asList
的返回对象是一个Arrays
内部类,并没有实现集合的修改方法。Arrays.asList
体现的是适配器模式,只是转换接口,后台的数据仍是数组。
String[] str = new String[] { "a", "b" };
List list = Arrays.asList(str);
第一种情况:list.add("c");
运行时异常。
第二种情况:str[0]= "gujin";
那么 list.get(0)也会随之修改。
- 不要在
foreach
循环里进行元素的 remove/add 操作。remove 元素请使用Iterator
方式,如果并发操作,需要对Iterator
对象加锁。
反例
List<String> a = new ArrayList<String>();
a.add("1");
a.add("2");
for (String temp : a) {
if("1".equals(temp)){
a.remove(temp);
}
}
正例:
Iterator<String> it = a.iterator();
while(it.hasNext()){
String temp = it.next();
if(删除元素的条件){
it.remove();
}
}
- 集合初始化时,尽量指定集合初始值大小。
- 使用
entrySet
遍历Map
类集合 KV,而不是keySet
方式进行遍历。
说明:keySet
其实是遍历了 2 次,一次是转为Iterator
对象,另一次是从hashMap
中取出 key 所对应的 value。而entrySet
只是遍历了一次就把 key 和 value 都放到了 entry 中,效率更高。
如果是 JDK8,使用Map.foreach
方法。 - 合理利用好集合的有序性(sort)和稳定性(order),避免集合的无序性(unsort)和不稳定性(unorder)带来的负面影响。
说明:稳定性指集合每次遍历的元素次序是一定的。有序性是指遍历的结果是按某种比较规则依次排列的。如:ArrayList
是 order/unsort;HashMap
是 unorder/unsort;TreeSet
是 order/sort。 - 利用
Set
元素唯一的特性,可以快速对一个集合进行去重操作,避免使用List
的contains
方法进行遍历、对比、去重操作。