Java 流式操作
流式操作,是 Java 8
除了Lambda
表达式外的又一重大改变。学习流式操作,就是学习java.util.stream
包下的API
,我们称之为Stream API
,它把真正的函数式编程引入到了 Java 中。
本小节我们将了解到什么是Stream
,为什么使用Stream API
, 流式操作的执行流程,如何实例化Stream
,Stream
的中间操作、Stream
的终止操作等内容。
1. 什么是 Stream
Stream
是数据渠道,用于操作数据源所生成的元素序列,它可以实现对集合(Collection
)的复杂操作,例如查找、替换、过滤和映射数据等操作。
我们这里说的Stream
不同于java
的输入输出流。另外,Collection 是一种静态的数据结构,存储在内存中,而Stream
是用于计算的,通过CPU
实现计算。注意不要混淆。
2. 为什么使用 Stream API
我们在实际开发中,项目中的很多数据都来源于关系型数据库(例如 MySQL、Oracle 数据库),我们使用SQL
的条件语句就可以实现对数据的筛选、过滤等等操作;
但也有很多数据来源于非关系型数据库(Redis
、MongoDB
等),想要处理这些数据,往往需要在 Java 层面去处理。
使用Stream API
对集合中的数据进行操作,就类似于 SQL 执行的数据库查询。也可以使用Stream API
来执行并行操作。简单来说,Stream API
提供了一种高效且易于使用的处理数据的方式。
3. 流式操作的执行流程
流式操作通常分为以下 3 个步骤:
创建
Stream
对象:通过一个数据源(例如集合、数组),获取一个流;中间操作:一个中间的链式操作,对数据源的数据进行处理(例如过滤、排序等),直到执行终止操作才执行;
终止操作:一旦执行终止操作,就执行中间的链式操作,并产生结果。
接下来我们就按照这 3 个步骤的顺序来展开学习Stream API
。
4. Stream 对象的创建
有 4 种方式来创建Stream
对象。
4.1 通过集合创建 Stream
Java 8 的java.util.Collection
接口被扩展,提供了两个获取流的默认方法:
default Stream<E> stream()
:返回一个串行流(顺序流);default Stream<E> parallelStream()
:返回一个并行流。
实例如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
串行流并行流的区别是:串行流从集合中取数据是按照集合的顺序的;而并行流是并行操作的,获取到的数据是无序的。
4.2 通过数组创建 Stream
Java 8 中的java.util.Arrays
的静态方法stream()
可以获取数组流:
static <T> Stream<T> stream(T[] array)
:返回一个数组流。
此外,stream()
还有几个重载方法,能够处理对应的基本数据类型的数组:
public static IntStream stream(int[] array)
:返回以指定数组作为其源的连续IntStream
;public static LongStream stream(long[] array)
:返回以指定数组作为其源的连续LongStream
;public static DoubleStream stream(double[] array)
:返回以指定数组作为其源的连续DoubleStream
。
实例如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
4.3 通过 Stream 的 of()
方法
可以通过Stream
类下的of()
方法来创建 Stream 对象,实例如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
4.4 创建无限流
可以使用Stream
类下的静态方法iterate()
以及generate()
创建无限流:
public static<T> Stream<T> iterate(final T seed, final UnaryOperator<T> f)
:遍历;public static<T> Stream<T> generate(Supplier<T> s)
:生成。
创建无限流的这种方式实际使用较少,大家了解一下即可。
5. Stream 的中间操作
多个中间操作可以连接起来形成一个流水线,除非流水线上触发终止操作,否则中间操作不会执行任何的处理。在终止操作时会一次性全部处理这些中间操作,称为“惰性求值”。下面,我们来学习一下常用的中间操作方法。
5.1 筛选与切片
关于筛选和切片中间操作,有下面几个常用方法:
filter(Predicate p)
:接收Lambda
,从流中清除某些元素;distinct()
:筛选,通过流生成元素的hashCode
和equals()
方法去除重复元素;limit(long maxSize)
:截断流,使其元素不超过给定数量;skip(long n)
:跳过元素,返回一个扔掉了前n
个元素的流。若流中元素不足n
个,则返回一个空流。与limit(n)
互补。
我们先来看一个过滤集合元素的实例:
- 1
- 2
- 3
实例中,有一个静态内部类Person
以及一个创建Person
的集合的静态方法createPeople()
,在主方法中,我们先调用该静态方法获取到一个Person
列表,然后创建了Stream
对象,再执行中间操作(即调用fliter()
方法),这个方法的参数类型是一个断言型的函数式接口,接口下的抽象方法test()
要求返回boolean
结果,因此我们使用Lambda
表达式,Lambda
体为person.getAge() >= 20
,其返回值就是一个布尔型结果,这样就实现了对年龄大于等于 20 的person
对象的过滤。
由于必须触发终止操作才能执行中间操作,我们又调用了forEach(System.out::println)
,在这里记住它作用是遍历该列表并打印每一个元素即可,我们下面将会讲解。另外,filter()
等这些由于中间操作返回类型为 Stream,所以支持链式操作,我们可以将主方法中最后两行代码合并成一行:
- 1
我们再来看一个截断流的使用实例:
- 1
- 2
根据运行结果显示,我们只打印了集合中的前两条数据。
跳过前 2 条数据的代码实例如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 1
- 2
- 3
distinct()
方法会根据equals()
和hashCode()
方法筛选重复数据,我们在Person
类内部重写这两个方法,并且在createPerson()
方法中,添加几个重复的数据 ,实例如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
5.2 映射
关于映射中间操作,有下面几个常用方法:
map(Function f)
:接收一个方法作为参数,该方法会被应用到每个元素上,并将其映射成一个新的元素;mapToDouble(ToDoubleFunction f)
:接收一个方法作为参数,该方法会被应用到每个元素上,产生一个新的DoubleStream
;mapToLong(ToLongFunction f)
:接收一个方法作为参数,该方法会被应用到每个元素上,产生一个新的LongStream
;flatMap(Function f)
:接收一个方法作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。
请查看如下实例:
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
- 5
- 6
上面实例中,我们调用sorted()
方法对集合元素进行了从小到大的自然排序,那么如果想要实现从大到小排序,任何实现呢?此时就要用到sorted(Comparator com)
方法定制排序,查看如下实例:
- 1
- 2
- 3
- 4
- 5
- 6
实例中,sorted()
方法接收的参数是一个函数式接口Comparator
,因此使用Lambda
表达式创建函数式接口实例即可,Lambda
体调用整型的比较方法,对返回的整型值做一个取反即可。
6. Stream 的终止操作
执行终止操作会从流的流水线上生成结果,其结果可以是任何不是流的值,例如List
、String
、void
。
在上面实例中,我们一直在使用forEach()
方法来执行流的终止操作,下面我们看看还有哪些其他终止操作。
6.1 匹配与查找
关于匹配与查找的终止操作,有下面几个常用方法:
allMatch(Predicate p)
:检查是否匹配所有元素;anyMatch(Predicate p)
:检查是否至少匹配一个元素;noneMatch(Predicate p)
:检查是否没有匹配所有元素;findFirst()
:返回第一个元素;findAny()
:返回当前流中的任意元素;count()
:返回流中元素总数;max(Comparator c)
:返回流中最大值;min(Comparator c)
:返回流中最小值;forEach(Consumer c)
:内部迭代(使用 Collection 接口需要用户去做迭代,称为外部迭代;相反Stream API
使用内部迭代)。
如下实例,演示了几个匹配元素相关方法的使用:
- 1
- 2
- 3
查找元素的相关方法使用实例如下:
- 1
- 2
- 3
- 4
- 5
实例中,我们观察到findFirst()
、findAny()
、max()
等方法的返回值类型为Optional
类型,关于这个Optional
类,我们将在下一小节具体介绍。
6.2 归约
关于归约的终止操作,有下面几个常用方法:
reduce(T identity, BinaryOperator b)
:可以将流中的元素反复结合起来,得到一个值。返回 T;reduce(BinaryOperator b)
:可以将流中的元素反复结合起来,得到一个值,返回Optional<T>
。
归约相关方法的使用实例如下:
- 1
- 2
6.3 收集
collect(Collector c)
:将流转换为其他形式。接收一个Collector
接口的实现,用于给Stream
中元素做汇总的方法。
实例如下:
- 1
Collector 接口中的实现决定了如何对流执行收集的操作(如收集到 List、Set、Map)。java.util.stream.Collectors
类提供了很多静态方法,可以方便地创建常用收集器实例,常用静态方法如下:
static List<T> toList()
:把流中元素收集到List
;static Set<T> toSet()
:把流中元素收集到Set
;static Collection<T> toCollection()
:把流中元素收集到创建的集合。
7. 小结
通过本小节的学习,我们知道了Stream
不同于java.io
下的输入输出流,它主要用于处理数据。Stream API
可用于处理非关系型数据库中的数据;想要使用流式操作,就要知道创建Stream
对象的几种方式;流式操作可分为创建Stream
对象、中间操作和终止操作三个步骤。多个中间操作可以连接起来形成一个流水线,除非流水线上触发终止操作,否则中间操作不会执行任何的处理。执行终止操作会从流的流水线上生成结果,其结果可以是任何不是流的值。