聚合操作是Java8的新特性,配合Lambda表达式和方法引用,支持以函数式风格操作集合对象或者并行运算。
一个简单的题目
用户在控制台中输入空格分隔的字符串,把用户输入内容当中的整数并求平均值。
对于这样一个问题,进行以下步骤完成:
- 将输入的字符存储在集合对象当中;
- 循环遍历集合,找出其中符合条件的字符串;
- 转换为数字并求和;
- 迭代结束之后求取平均值。
传统实现方式
List<String> strings = Arrays.asList("Lambda", "Java8", "8080", "360", "456", "7z", "-32");
float sum = 0;
int total = 0;
for (String s: strings) {
if (s.matches("-?\\d+")) {
total++;
sum += Integer.parseInt(s);
}
}
System.out.println(sum/total);
这是一种传统而且普遍的实现方式,处理集合元素通常都是通过for循环或者迭代器Iterator来实现。
使用聚合操作
聚合操作(Aggregate Operations)不同于传统风格的使用方式。这里涉及了两个概念:管道(Pipeline)和流(Stream)。
- 管道可以理解为聚合操作序列;
- 流是一个元素序列,但是不同于集合,它不是存储元素的数据结构,可以作为管道的数据源。
使用Java8的聚合操作完成遍历并输出符合条件的字符串:
List<String> strings = Arrays.asList("Lambda", "Java8", "8080", "360", "456", "7z");
strings.stream().filter(s -> s.matches("-?\\d+")).forEach(System.out::println);
其中strings.stream()
提供了一个流,管道内有两个操作,filter
用于过滤数据,forEach
处理过滤后的每个数据。配合Lambda和方法引用,看起来简洁明了了许多。
需要注意的是,管道需要三个部分组成:
- 一个数据源,如上
strings.stream()
; - 零到多个中间操作,如上
filter
; - 一个终止操作,如上
forEach
。
接下来就进行求取平均值的操作:
strings.stream()
.filter(s -> s.matches("-?\\d+"))
.mapToInt(Integer::parseInt)
.average()
.getAsDouble();
filter
返回一个满足条件的流之后,通过mapToInt
把其中的每个字符串转换为整数。mapToInt
返回了一个IntStream
的流对象,这个流包含了所有整数值。最后IntStream
的average
方法计算了IntStream
对象的平均值并返回了OptionalDouble
对象。
如果IntStream中没有任何元素,那么
getAsDouble
将抛出NoSuchElementException
异常。
程序当中涉及到的API可以参考java.util.stream包的文档。
average
就是管道的结束操作。类似average
这样把流最终结合为一个值的操作可以称作是归纳操作(reduction operations)。
聚合操作与迭代方式的不同之处
- 进行内部迭代
聚合操作不需要程序员通过hasNext
和next
方法来迭代元素并处理,只需要告诉聚合操作需要迭代什么集合,不需要告诉它如何完成迭代,如何迭代交由JDK内部来完成。外部迭代方式仅仅能够顺序操作集合元素,但是内部迭代却没有这个限制,所以内部迭代还可以完成并行计算,将问题分解为子问题进行求解,最后合并子问题的结果形成问题的解。 - 从一个流当中处理数据
从上面的例子可以看出,聚合操作的对象是在流上进行的,不是传统的集合对象,所以可以把这种操作方式称作流式操作(stream operations)。 - 操作行为作为参数
这一点主要体现在了Lambda表达式的应用,通过函数式风格来处理数据。