Java 8 Stream 学习笔记

Stream

  • 是一系列的计算操作的合集,不是用于储存数据的数据结果,使用目的在于将一系列数据转化成目标结果。

  • 产生结果,并且不修改源数据对象。

  • 对于Intermediate操作(各类型的计算操作),只要不调用Terminal操作,流不会开始遍历。当定义了多个Intermediate操作时,真正执行时会有一个内部转换,仅遍历一次完成所有的计算操作。

  • 数据源可以是无限的,可通过操作将其转化为有限的结果,比如limit(10)。

  • 在一个流的生命周期内,源数据中的每个元素仅会被访问一次。

需要研究JDK代码。

构造流的方法

  • Collection的 stream() 和 parallelStream() 方法。

  • Arrays.stream(Object[])

  • 静态工厂方法,比如 Stream.of(Object[]), IntStream.range(int, int), Stream.iterate(Object, UnaryOperator)

  • BufferedReader.lines()

  • Files

  • Random.ints()

  • 其他(待研究)

操作类型

Intermediate

Intermediate操作总是返回一个新的流,并且不涉及任何实际操作。

分为有状态无状态两种。
无状态:例如 filter() 和 map(),不对任何后续元素产生影响,每个元素可独立操作。
有状态:例如 distinct() 和 sort(),处理元素时,需要参考已处理元素的状态。有状态的操作会需要遍历所有元素才可得出结果(例如排序),也就是说,在并行处理模式下,部分元素会需要重复计算 或 需要一个缓存。

Terminal

遍历元素并输出一个结果。一个流只能有一个Terminal操作,遍历完成后,流被消耗完毕,无法再次遍历。

特例:iterator() 和 spliterator() (待研究)

Short-Circuiting

  • Intermidiate:当这个操作的对象是一个无限大的数据源时,这个操作会产生有限的结果。

  • Terminal:当这个操作的对象是一个无限大的数据源时,这个操作会在有限的时间内完成。

并行

任何流都可以应用并行操作。与单线程序列化操作不同的仅仅在于生成流的方法。

不干涉(non-interference)

遍历过程中,绝对不会修改原数据。

Reduction Operation (fold)

输入是一系列元素,输出是一个汇总的结果,例如 求和 或者 求最大值。

在parallelStream的模式下,Reduction Operation也能正确执行。它会在各子集中求出一个结果,然后汇总所有的子结果,得出最终的值。

<U> U reduce(U identity,  // initial seed value for the reduction and a default result
              BiFunction<U, ? super T, U> accumulator,  // take partial result and the next element to produce a new partial result
              BinaryOperator<U> combiner);  // combine partial results to a final result

Mutable reduction

将一个集合整合为目标集合。

 <R> R collect(Supplier<R> supplier,  // a function to construct new instances of the result container
               BiConsumer<R, ? super T> accumulator,  // incorporate an input element into a result container
               BiConsumer<R, R> combiner);  // a combining function to merge contents

参考

JDK1.8 Package java.util.stream

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。