java8的又一特性就是 流(Stream),流主要是对数据源(集合、数组等)的一种处理方式,有高效的聚合操作、大批量的数据处理,同时也内置了许多运算方式,包括筛选、排序、聚合等 ,特别提醒:流运用了大量的lambda表达式。 这里只是列出一些常用的知识点,帮助你快速了解它。
几大特点
- 与lambda表达式结合,代码极简,可读性高
- 提供并行操作,充分发挥多核处理器优势
- 进行并行操作,无需额外编写多线程代码即可实现高效并发程序,规避多线程代码问题
简单基本概念
- 元素 流Stream是来自数据源的元素队列,本身不具备元素
- 数据源 包括包含集合、数组、I/O channel、generator(发生器)等
- 聚合操作 类似SQL中的filter、map、find、match、sorted等操作
- 管道运算 Stream在Pipeline中运算后返回Stream对象本身,这样多个操作串联成一个Pipeline,并形成fluent风格的代码。这种方式可以优化操作,如延迟执行(laziness)和短路( short-circuiting)。(我理解为链式操作)
- 内部迭代 不同于java8以前对集合的遍历方式(外部迭代),采用访问者模式(Visitor)实现了内部迭代。
- 并行运算 Stream API支持串行(stream() )或并行(parallelStream() )的两种操作方式。
简单实例
- java8之前
public static void main(String[] args)
{
List<Integer> numbers = Arrays.asList(-1, -2, 0, 4, 5);
long count = 0;
for(Integer number: numbers)
{
if(number > 0)
{
count++;
}
}
System.out.println("Positive count: " + count);
}
通常利用for循环遍历
- java8之后
public static void main(String[] args)
{
List<Integer> numbers = Arrays.asList(-1, -2, 0, 4, 5);
long count = numbers.parallelStream().filter(i -> i>0).count();
System.out.println("Positive count: " + count);
}
上例中,使用filter()
方法对数组进行了过滤,使用count()方法对过滤后的数组进行了大小统计,且使parallelStream()
方法为集合创建了并行流,自动采用并行运算提高速度。在更复杂的场景,还可以用forEach()、map()、limit()、sorted()、collect()
等方法进行进一步的流运算。
并且 通常会和lambda表达式一起使用,使得代码更加优雅。
常用接口
- Stream的生成( 串行流 :
stream()
; 并行流 :parallelStream()
)
List list = new ArrayList();
list.stream().//接下来管道操作
- forEach()方法 (用来迭代流中的每一个数据)
List<Integer> numbers = Arrays.asList(-1, -2, 0, 4, 5);
numbers.stream().forEach(n -> System.out.println("List element: " + n));
- map()方法 (将流中的所有元素用Function对象进行运算,生成新的流对象)
List<Integer> numbers = Arrays.asList(-1, -2, 0, 4, 5);
numbers.stream().map( n -> Math.abs(n)).forEach(n -> System.out.println("Element abs: " + n));
- flatMap()方法 (比map()方法拥有更高的映射深度)
用flatMap()方法如下:
List<String> list = Arrays.asList("1 2", "3 4", "5 6");
list.stream().flatMap(item -> Arrays.stream(item.split(" "))).forEach(System.out::println);
而用map()方法:
List<String> list = Arrays.asList("1 2", "3 4", "5 6");
list.stream().map(item -> Arrays.stream(item.split(" "))).forEach(n ->n.forEach(System.out::println));
可见,用map()方法,返回了一个“流中流”,需要在每个Stream元素遍历时,再加一层forEach进行遍历。
- filter()方法 (过滤)
List<Integer> numbers = Arrays.asList(-1, -2, 0, 4, 5);
long count = numbers.parallelStream().filter(i -> i>0).count();
System.out.println("Positive count: " + count);
- reduce()方法 (为折叠操作,用于将流中的所有值合成一个)
List<Integer> numbers = Arrays.asList(-1, -2, 0, -1, 4, 5, 1);
Integer total = numbers.stream().reduce((t, n) -> t + n).get();
System.out.println("Total: " + total);
- collect()方法 (将流转为数据源 (集合等))
collect()方法的参数为一个java.util.stream.Collector类型对象,可以用java.util.stream.Collectors工具类提供的静态方法来生成,Collectors类实现很多的归约操作,如Collectors.toList()、Collectors.toSet()、Collectors.joining()(joining适用于字符串流)等
List<Integer> numbers = Arrays.asList(-1, -2, 0, 4, 5);
List<Integer> abss = numbers.stream().map( n -> Math.abs(n)).collect(Collectors.toList());
System.out.println("Abs list: " + abss);
- 数值操作的方法
Stream采用mapToInt()、mapToLong()、mapToDouble()
三个方法分别生成IntStream 、LongStream 、DoubleStream 三个接口类型的对象
IntStream 、LongStream 、DoubleStream 三个接口类型都有一个summaryStatistics()方法,其中,
IntStream 的方法是:IntSummaryStatistics summaryStatistics();
LongStream 的方法是:LongSummaryStatistics summaryStatistics();
DoubleStream 的方法是:DoubleSummaryStatistics summaryStatistics();
在IntSummaryStatistics、LongSummaryStatistics 、DoubleSummaryStatistics
三个接口类型(位于java.util包下)中,都有诸如统计数量、最大值、最小值、求和、平均值等方法(方法名和返回类型可能不同),可以方便的进行数值统计。
看这么多文字,还是来个例子消化比较好:
List<Integer> numbers = Arrays.asList(-1, -2, 0, 4, 5);
IntSummaryStatistics stats = numbers.stream().mapToInt((x) -> x).summaryStatistics();
System.out.println("Max : " + stats.getMax());
System.out.println("Min : " + stats.getMin());
System.out.println("Sum : " + stats.getSum());
System.out.println("Average : " + stats.getAverage());
System.out.println("Count : " + stats.getCount());
- 其它方法
Stream API还有一些其它的方法,比如:
limit() 获取指定数量的流
sorted() 对流进行排序
distinct() 去重
skip() 跳过指定数量的元素
peek() 生成一个包含原Stream的所有元素的新Stream,并指定消费函数
count() 计算元素数量
这部分只是流stream的冰山一角,想要深入的朋友可以去看下java8的关于流这部分的源码,进行深入学习。