Java8中提供了Collectors类来做收集器。以下介绍都是使用流中的collect方法接收Collector接口的实现。
一、规约和汇总
- 查找流中的最大值和最小值
//Collectors提供了maxBy和minBy来计算流中的最大值和最小值
Comparator<Dish> dishCaloriesComparator = Comparator.comparingInt(Dish::getCalories);
Optional<Dish> mostCalorieDish = menu.stream()
.collect(maxBy(dishCaloriesComparator));
汇总
提供了Collectors.summingInt、Collectors.summingLong、Collectors.summingDouble来实现累加操作。
还有Collectors.averagingInt来计算平均,Collectors.summarizingInt统计综合值等。连接字符串
Collectors.joining()或者Collectors.joining(“字符”)广义的规约汇总
Collectors.reducing,与reduce方法相比,这种方法更易于并行处理,详情见《Java8实战》P117
二、分组
Collectors.groupingBy工厂方法返回的收集器可以进行分组,分组的结果为一个Map。
案例:整数列表根据模 5 的值分组求和。
Map<Integer, Integer> groupByMod5 = list.stream()
.collect(groupingBy(i -> i % 5, summingInt(Integer::intValue)));
三、分区
分区是分组的特殊情况:由一个谓词(返回一个布尔值的函数)作为分区函数,它称为分区函数。返回结果Map中包含true一组和false一组。分区函数为:Collectors.partitioningBy。
案例:整数列表分奇偶求和。
Map<Boolean, Integer> partedByEven = list.stream()
.collect(partitioningBy(i -> i % 2 == 0, summingInt(Integer::intValue)));
System.out.println("集合偶数和为:" + partedByEven.get(true));
System.out.println("集合奇数和为:" + partedByEven.get(false));
四、收集器接口
//在下面的接口中:
//T是流中要收集的项目的泛型,A是累加器的类型,累加器是在收集过程中用于累计部分结果的对象。
//R是收集操作得到的对象(通常但并不一定是集合)类型
public interface Collector<T, A, R> {
//建立新的容器,返回一个结果为空的Supplier,即无参数函数
Supplier<A> supplier();
//将元素添加到容器,返回执行归约操作的函数
BiConsumer<A, T> accumulator();
//对容器结果应用最终转换
Function<A, R> finisher();
//合并两个结果的容器
BinaryOperator<A> combiner();
//返回一个不可变的Characteristics集合,其定义了收集器的行为
Set<Characteristics> characteristics();
}
补充:Characteristics是一个包含三个项目的枚举。
- UNORDERED——归约结果不受流中项目的遍历和累积顺序的影响。
- CONCURRENT——accumulator函数可以从多个线程同时调用,且该收集器可以并行归约流。如果收集器没有标为UNORDERED,那它仅在用于无序数据源时才可以并行归约。
- IDENTITY_FINISH——这表明完成器方法返回的函数是一个恒等函数,可以跳过。这种情况下,累加器对象将会直接用作归约过程的最终结果。这也意味着,将累加器A不加检 15 查地转换为结果R是安全的。
自定义接口实现: