Stream流

# 基本使用

Stream流是JDK8推出的新特性

思想： Stream流相当于工厂里面的流水线，对数据进行加工处理。 作用：简化集合和数组的操作。

集合获取Stream流的方式

Collection接口中	说明
default Stream<E> stream()	获取当前集合对象的Stream流

数组获取Stream流的方式

Stream接口中	说明
public static<T> Stream<T> of(T... values)	获取当前数组/可变数据的Stream流

示例：Stream<String> stream = Stream.of("a","b","c")

Stream流的常见中间方法

名称	说明
Stream<T> filter(Predicate<? super T> predicate)	用于对流中的数据进行过滤。
Stream<T> limit(long maxSize)	获取前几个元素
Stream<T> skip(long n)	跳过前几个元素
Stream<T> distinct()	去除流中重复的元素。依赖(hashCode和equals方法)
static <T> Stream<T> concat(Stream a, Stream b)	合并a和b两个流为一个流
<R> Stream <R> map( Function<? super T,? extends R> mapper )	将流对象类型由前一个泛型转为后一个泛型，参数是接口，需要在重写方法中进行封装转换，或是用于遍历集合，对集合中的元素进行逐个加工

Stream流的常见终结方法

名称	说明
void forEach(Consumer action)	对此流的每个元素执行遍历操作
long count()	返回此流中的元素数
collect(Collectors.joining(","))	收集流中数据并以"，"为分隔拼接成字符串

注意：

中间方法也称为非终结方法，同一个Stream流对象只能使用一次中间方法，调用完成后返回新的Stream流可以继续使用，支持链式编程，并且不调用终结方法的话中间方法是不会执行的。
终结操作方法，调用完成后流就无法继续使用了，原因是不会返回Stream了。
Map集合需要通过keySet()方法或values()方法转换成Set或Collection再使用Stream流

示例：

public class Testcode {
    public static void main(String[] args) throws InterruptedException {
        List<String> list = new ArrayList<>();

        Stream<String> stream = list.stream();

        stream.filter(s -> s.length() == 3).limit(5).forEach(System.out::println);
    }
}

1
2
3
4
5
6
7
8
9

注：方法引用是一种简写lambda表达式的方式。等同于lambda表达式。

如上述代码：

// 匿名内部类
stream.filter(s -> s.length() == 3).limit(5).forEach(new Consumer<String>() {
            @Override
            public void accept(String s) {
                System.out.println(s);
            }
        });

// 简化为lambda
stream.filter(s -> s.length() == 3).limit(5).forEach(s -> System.out.println(s));

// 简化为方法引用
stream.filter(s -> s.length() == 3).forEach(System.out::println);

1
2
3
4
5
6
7
8
9
10
11
12
13

收集Stream流数据的常用方法

方法	说明
R collect(Collector collector)	开始收集Stream流，指定收集器
Object[] toArray()	把元素收集到数组中

工具类Collectors提供了具体收集的方式

方法	说明
public static <T> Collector toList()	把元素收集到List集合中
public static <T> Collector toSet()	把元素收集到Set集合中
public static <T> Collector toMap(key,value)	把元素收集到map集合中

示例：

public class Testcode {
    public static void main(String[] args) throws InterruptedException {
        List<String> list = new ArrayList<>();

        Stream<String> stream = list.stream();

        stream.filter(s -> s.length() == 3).forEach(System.out::println);

        List<String> lists = stream.collect(Collectors.toList());
        Set<String> set = stream.collect(Collectors.toSet());
        String[] strs = (String[]) stream.toArray();
        
        // 转map
        List<Map<String, Object>> countMapList = this.getBaseMapper().getRecordCountOfMonth(startDate, endDate);
        Map<String, Integer> countMap = countMapList.stream()
            .collect(Collectors.toMap(map -> (String) map.get("date"),
                                      map -> (Integer) map.get("count")));
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

分组排序：

//分组排序
Map<String, List<Student>> map = list.stream().collect(
	Collectors.groupingBy(Student::getName, HashMap::new, 		
      Collectors.collectingAndThen(Collectors.toList(),
      //正序
	  list -> list.stream().sorted(Comparator.comparing(Student::getScore)) 
  //倒序
  //list -> list.stream().sorted(Comparator.comparing(Student::getScore).reversed()) 
	    .collect(Collectors.toList())
)));

1
2
3
4
5
6
7
8
9
10

分组抽取字段

List<MyObject> list = ...; // 假设这是对象列表
Map<String, List<String>> namesByCategory = list.stream()
    .collect(Collectors.groupingBy(MyObject::getCategory, // 按 category 分组
             Collectors.mapping(MyObject::getName, Collectors.toList()))); // 提取每个组中对象的 name 字段

1
2
3
4

# 深入剖析Java Stream底层源码 (opens new window)

# 1 Stream的使用

在深入学习Stream的本质之前，我们需要先熟悉Stream的使用规则。对Stream有了整体的认识之后，才能更好的理解它的本质。

# 1.1 使用步骤

使用Stream只需要遵循3个步骤：

创建流。
逻辑处理。
收集结果。

例如，我们需要考试分数大于60分的人数：

// 考试分数数组
int[] nums = new int[]{59,59,59,59,59,59,60,60,98,99,100};
// 第一步：创建流
IntStream numsStream = Arrays.stream(nums);
// 第二部：逻辑处理：过滤考试分数大于等于60分的元素
IntStream filteredStream = numsStream.filter(num -> num >= 60);
// 第三步：收集结果：计算元素个数
long count = filteredStream.count();
System.out.println(count);  // 5

1
2
3
4
5
6
7
8
9

其中，逻辑处理步骤又称为中间操作（intermediate operations）。中间操作可以由多个步骤组成，例如我们可能还需要统计其中男生的人数，则可以再添加一个flter()处理步骤。收集结果步骤又称为终止操作（terminal operations）。执行终止操作后就意味着该流程结束了，因此一个流在处理过程中只能有一个终止操作。如果此时再次执行中间操作或终止操作，则会抛出java.lang.IllegalStateException。学习怎么使用Stream，其实就是学习这三个步骤对应的API，以及它们对应的逻辑。

# 1.2 辨别API

如何辨别创建、中间操作和终止操作API：

创建：将其他类型数据（如数组）转换成流，如method(int[]):Stream。
中间操作：将旧流转换成新流，如method(Stream):Stream。
终止操作：将流转换成其他类型数据：如method(Stream):int。

# 2 基于BaseStream的接口体系

在谈论Java SE 8引入的流库时，我们通常会称呼它为Stream。实际上，Stream只是Java SE 8流库中的其中一类工具，专门用来处理引用类型的流处理。就好比IO流中既有InputStream一类专门读取字节流的工具，也有Reader一类专门读取字符流的工具。

# 2.1 BaseStream

Java SE 8引入的流库的构建于以BaseStream为核心的接口体系之上： (opens new window) BaseStream中定义了所有流都具备的通用方法：

iterator():Iterator<T> 获取元素的迭代器
spliterator():Spliterator<T> 获取元素的分离器
isParallel():boolean 判断是否是并行流
sequential():S 将当前流转换成顺序流
parallel():S 将当前流转换成并行流
unordered():S 将当前流转换成无序流
onClose(Runnable):S 添加关闭流事件
close() 关闭流，此时所有关闭流事件都会触发

# 2.2 针对不同数据类型的扩展

根据处理数据类型的不同，在BaseStream的基础之上进一步扩展出IntStream、LongStream、DoubleStream以及Stream等子接口。这些子接口所提供的方法在使用逻辑上都没有什么差别，只是由于它们所操作的元素类型不同，底层实现逻辑也有所不同。顾名思义，IntStream、LongStream和DoubleStream分别是对int、long和double基本数据类型进行处理的流。如：

int[] ints = new int[]{1,2,3,4,5,6,7,8,9};
IntStream intStream = Arrays.stream(ints);
int intSum = intStream.sum();
long[] longs = new long[]{1L,2L,3L,4L,5L,6L,7L,8L,9L};
LongStream longStream = Arrays.stream(longs);
long longSum = longStream.sum();
double[] doubles = new double[]{1.0D,2.0D,3.0D,4.0D,5.0D,6.0D,7.0D,8.0D,9.0D};
DoubleStream doubleStream = Arrays.stream(doubles);
double doubleSum = doubleStream.sum();
System.out.println(intSum); // 45
System.out.println(longSum);    // 45
System.out.println(doubleSum);  // 45.0

1
2
3
4
5
6
7
8
9
10
11
12

而Stream则是对引用数据类型类型进行处理的流。如：

String[] strings = new String[]{"Hello", ", ", "Stream", "!"};
Stream&lt;String> stringStream = Arrays.stream(strings);
long count = stringStream.count();
System.out.println(count);  // 4

1
2
3
4

此时，我们可以发现。针对元素数据类型性质的不同，这些子接口所扩展的方法也有所不同：

所有子接口都扩展了诸如filter()、map()、flatMap()、distinct()、sorted()和of()等通用方法。
所有子接口都扩展了转化成其他流的方法，如Stream提供了mapToInt()、mapToLong()和mapToDouble()，而IntStream提供了mapToObj()、mapToLong()和mapToDouble()。
针对数值数据类型的特性，IntStream、LongStream和DoubleStream子接口提供了sum()、average()和summaryStatistics()等数值计算方法，而Stream则没有。
IntStream、LongStream和DoubleStream子接口提供了将元素转型成对应包装类的方法boxed()。

# 2.3 处理其他基本数据类型

我们可以发现这么一个问题，JDK只对int、long和double这三种基本数据类型提供了对应的流接口。那么如果需要处理基本数据类型元素（byte、short、char、float和boolean)），我们该怎么处理呢？有些人可能会尝试使用Stream进行处理，但此时会将整个数组当作是一个元素进行处理：

byte[] bytes = new byte[]{1,2,3,4,5,6,7,8,9};
Stream<byte[]> byteStream = Stream.of(bytes);
System.out.println(byteStream.count()); // 1

1
2
3

实际上，JDK并没有提供这方面的支持。由于类型自动提升，它允许使用IntStream处理byte、short、char、和boolean，使用DoubleStream处理float。我们也可以转换一下思路，提供对应包装类的数组即可：

Byte[] bytes = new Byte[]{1,2,3,4,5,6,7,8,9};
Stream<Byte> byteStream = Stream.of(bytes);
System.out.println(byteStream.count()); // 9

1
2
3

# 3 基于AbstractPipeline的继承结构

上一节讨论的是流的接口，规定了流的操作逻辑和API。为了理解流的实现，我们需要深入学习流的数据结构，也就是它们的类结构。

# 3.1 AbstractPipeline

流的数据结构的实现基于AbstractPipeline。顾名思义，流的底层实现是基于管道（pipeline）的。通过后续对源码的阅读，我们会发现它是一个双向链表： (opens new window) AbstractPipeline类图如下： (opens new window) 除了两个用于提示消息的静态变量，其他核心成员变量如下：

sourseStage：管道的源阶段，源阶段对象指向自身。
previousStage：当前阶段的上个阶段，源阶段对象没有上个阶段，指向null。
nextStage：当前阶段的下个阶段，管道最后一个阶段没有下个阶段，指向null。
sourceOrOpFlags：当前对象所处阶段的标志（源阶段、中间操作阶段或终止操作阶段），本质上就是记录当前对象在整个管道中所在的位置（第一个、中间或最后一个）。详细查看StreamOpFlag枚举类。
depth：主要用于解析时定位当前对象所处调用队列深度，本质上是前面待执行阶段对象的个数。顺序流为前面中间操作的个数，并行流为前面状态操作的个数。
combinedFlags：主要用于解析时确定当前对象所需要执行的中间操作，是源阶段标志和前面所有中间操作标志的结合。
sourceSpliterator：数据源元素分隔器，用于获取单个元素。只有源阶段对象中的才会起作用。
sourceSupplier：数据源元素提供器，封装了数据源。只有源阶段对象中的才会起作用。
linkedOrConsumed：标志管道是链接状态还是终止状态。
sourceAnyStateful：标记管道是否存在状态操作。只有源阶段对象中的才会起作用。
sourceCloseAction：关闭流事件。
parallel：标记管道是顺序流还是并行流。只有源阶段对象中的才会起作用。

# 3.2 不同数据类型的实现

在此基础之上，JDK针对int、long、double以及引用类型元素，提供了对应的实现类。继承结构如下： (opens new window) 其中，XxxPipeline表示对应的管道，而各自的内部类Head表示源阶段，StatelessOp和StatefulOp分别表示无状态和有状态的中间操作阶段。此时，我们可以将流的逻辑结构更加具体化： (opens new window) 需要注意的是，Head内部类是具体的，因为对于某种数据类型的流操作来说，它的初始状态都是固定的，只需要保存数据源即可。而StatelessOp和StatefulOp内部类却是抽象类，因为中间操作的数量和逻辑是不确定的。为了便于中间操作的扩展，需要定义为抽象的，需要具体某个逻辑时再实现opWrapSink()、opEvaluateParallel()以及opEvaluateParallelLazy()方法即可。在这里我们以针对引用类型元素的ReferencePipeline为例，进行说明。它的源阶段（Head内部类）只是实现了对应的抽象方法，并没有新增额外的成员变量。源码如下：

/**
 * Source stage of a ReferencePipeline.
 *
 * @param <E_IN> type of elements in the upstream source
 * @param <E_OUT> type of elements in produced by this stage
 * @since 1.8
 */
static class Head<E_IN, E_OUT> extends ReferencePipeline<E_IN, E_OUT> {
    /**
     * Constructor for the source stage of a Stream.
     *
     * @param source {@code Supplier<Spliterator>} describing the stream source
     * @param sourceFlags the source flags for the stream source, described in {@link StreamOpFlag}
     */
    Head(Supplier<? extends Spliterator<?>> source,
         int sourceFlags, boolean parallel) {
        super(source, sourceFlags, parallel);
    }

    /**
     * Constructor for the source stage of a Stream.
     *
     * @param source {@code Spliterator} describing the stream source
     * @param sourceFlags the source flags for the stream source, described in {@link StreamOpFlag}
     */
    Head(Spliterator<?> source,
         int sourceFlags, boolean parallel) {
        super(source, sourceFlags, parallel);
    }

    @Override
    final boolean opIsStateful() {
        throw new UnsupportedOperationException();
    }

    @Override
    final Sink<E_IN> opWrapSink(int flags, Sink<E_OUT> sink) {
        throw new UnsupportedOperationException();
    }

    // Optimized sequential terminal operations for the head of the pipeline

    @Override
    public void forEach(Consumer<? super E_OUT> action) {
        if (!isParallel()) {
            sourceStageSpliterator().forEachRemaining(action);
        }
        else {
            super.forEach(action);
        }
    }

    @Override
    public void forEachOrdered(Consumer<? super E_OUT> action) {
        if (!isParallel()) {
            sourceStageSpliterator().forEachRemaining(action);
        }
        else {
            super.forEachOrdered(action);
        }
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62

它的无状态中间操作阶段（StatelessOp内部类）仅实现了部分抽象方法：

/**
 * Base class for a stateless intermediate stage of a Stream.
 *
 * @param <E_IN> type of elements in the upstream source
 * @param <E_OUT> type of elements in produced by this stage
 * @since 1.8
 */
abstract static class StatelessOp<E_IN, E_OUT>
        extends ReferencePipeline<E_IN, E_OUT> {
    /**
     * Construct a new Stream by appending a stateless intermediate
     * operation to an existing stream.
     *
     * @param upstream The upstream pipeline stage
     * @param inputShape The stream shape for the upstream pipeline stage
     * @param opFlags Operation flags for the new stage
     */
    StatelessOp(AbstractPipeline<?, E_IN, ?> upstream,
                StreamShape inputShape,
                int opFlags) {
        super(upstream, opFlags);
        assert upstream.getOutputShape() == inputShape;
    }

    @Override
    final boolean opIsStateful() {
        return false;
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

他的有状态中间操作（StatefulOp内部类）除了实现部分抽象方法，还提供了与并行流处理相关的opEvaluateParallel()方法。源码如下：

/**
 * Base class for a stateful intermediate stage of a Stream.
 *
 * @param <E_IN> type of elements in the upstream source
 * @param <E_OUT> type of elements in produced by this stage
 * @since 1.8
 */
abstract static class StatefulOp<E_IN, E_OUT>
        extends ReferencePipeline<E_IN, E_OUT> {
    /**
     * Construct a new Stream by appending a stateful intermediate operation
     * to an existing stream.
     * @param upstream The upstream pipeline stage
     * @param inputShape The stream shape for the upstream pipeline stage
     * @param opFlags Operation flags for the new stage
     */
    StatefulOp(AbstractPipeline<?, E_IN, ?> upstream,
               StreamShape inputShape,
               int opFlags) {
        super(upstream, opFlags);
        assert upstream.getOutputShape() == inputShape;
    }

    @Override
    final boolean opIsStateful() {
        return true;
    }

    @Override
    abstract <P_IN> Node<E_OUT> opEvaluateParallel(PipelineHelper<E_OUT> helper,
                                                   Spliterator<P_IN> spliterator,
                                                   IntFunction<E_OUT[]> generator);
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

# 4 详细解析流的创建、中间操作和终止操作

# 4.1 创建流：StreamSupport工具类

StreamSupport是一个用来创建和操作流的基础工具类，它提供了创建各种数据类型流的静态方法：

stream()：创建Stream<T>
intStream()：创建IntStream
longStream()：创建LongStream
doubleStream()：创建DoubleStream

这些方法并没有十分深奥，它们进行是对各种Head内部类的构造函数进行了封装。例如：

public static <T> Stream<T> stream(Spliterator<T> spliterator, boolean parallel) {
    Objects.requireNonNull(spliterator);
    return new ReferencePipeline.Head<>(spliterator,
                                        StreamOpFlag.fromCharacteristics(spliterator),
                                        parallel);
}

1
2
3
4
5
6

许多创建流API的内部都使用该工具类，例如java.util.Collection##stream方法源码如下：

default Stream<E> stream() {
    return StreamSupport.stream(spliterator(), false);
}

1
2
3

如果需要创建并行流，则会设置Head对象的parallel成员变量为true。例如：

default Stream<E> parallelStream() {
    return StreamSupport.stream(spliterator(), true);
}

1
2
3

顺序流和并行流，在创建和中间操作阶段，都仅仅是Head对象的parallel成员变量而已。

# 4.2 中间操作

本质上，中间操作是对管道这个双向链表添加新节点的操作：

创建StatelessOp或StatefulOp中间操作阶段的新节点。
将新节点链接到管道尾部。
返回新节点。

事实确实如此，以java.util.stream.ReferencePipeline##filter为例，它会创建StatelessOp中间操作：

public final Stream<P_OUT> filter(Predicate<? super P_OUT> predicate) {
    Objects.requireNonNull(predicate);
    return new StatelessOp<P_OUT, P_OUT>(this, StreamShape.REFERENCE,
                                 StreamOpFlag.NOT_SIZED) {
        @Override
        Sink<P_OUT> opWrapSink(int flags, Sink<P_OUT> sink) {
            return new Sink.ChainedReference<P_OUT, P_OUT>(sink) {
                @Override
                public void begin(long size) {
                    downstream.begin(-1);
                }

                @Override
                public void accept(P_OUT u) {
                    if (predicate.test(u))
                        downstream.accept(u);
                }
            };
        }
    };
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

其中，该中间操作的逻辑会被保存到opWrapSink()方法返回的匿名Sink对象中。只有等到终止操作时，才会遍历这些对象，进行对应的业务逻辑操作。所以说流的操作时尽可能惰性执行的。

# 4.3 终止操作

执行了终止操作，意味着需要遍历管道的所有阶段，按照各个中间操作处理数据源。终止操作的核心在于java.util.stream.AbstractPipeline##evaluate(java.util.stream.TerminalOp<E_OUT,R>)方法。例如，我们需要考试分数大于60分的总分数：

// 考试分数数组
int[] nums = new int[]{59,59,59,59,59,59,60,60,98,99,100};
// 第一步：创建流
IntStream numsStream = Arrays.stream(nums);
// 第二部：逻辑处理：过滤考试分数大于等于60分的元素
IntStream filteredStream = numsStream.filter(num -> num >= 60);
// 第三步：收集结果：计算元素的加和
long sum = filteredStream.reduce(0, Integer::sum);
System.out.println(sum);  // 417

1
2
3
4
5
6
7
8
9

java.util.stream.IntPipeline##reduce(int, java.util.function.IntBinaryOperator)是一个终止操作：

public final int reduce(int identity, IntBinaryOperator op) {
    return evaluate(ReduceOps.makeInt(identity, op));
}

1
2
3

它会调用evaluate()方法：

final <R> R evaluate(TerminalOp<E_OUT, R> terminalOp) {
    assert getOutputShape() == terminalOp.inputShape();
    // 校验当前流对象是否已经终止
    if (linkedOrConsumed)
        throw new IllegalStateException(MSG_STREAM_LINKED);
    linkedOrConsumed = true;
    // 判断顺序流或并行流，进行对应处理
    return isParallel()
           ? terminalOp.evaluateParallel(this, sourceSpliterator(terminalOp.getOpFlags()))
           : terminalOp.evaluateSequential(this, sourceSpliterator(terminalOp.getOpFlags()));
}

1
2
3
4
5
6
7
8
9
10
11

isParallel()方法会校验管道源阶段对象的parallel成员变量：

public final boolean isParallel() {
    return sourceStage.parallel;
}

1
2
3

如果是并行流，它会创建不同的java.util.concurrent.CountedCompleter实现类对象进行执行任务。如果是顺序流，则会按顺序调用中间操作进行处理。在这个过程中需要获取每个中间操作保存的执行逻辑，核心在于java.util.stream.AbstractPipeline##wrapSink方法：

final <P_IN> Sink<P_IN> wrapSink(Sink<E_OUT> sink) {
    Objects.requireNonNull(sink);

    for ( @SuppressWarnings("rawtypes") AbstractPipeline p=AbstractPipeline.this; p.depth > 0; p=p.previousStage) {
        sink = p.opWrapSink(p.previousStage.combinedFlags, sink);
    }
    return (Sink<P_IN>) sink;
}

1
2
3
4
5
6
7
8

这里的Sink对象保存着中间操作的执行逻辑，它本质上是一个单向链表，具体可以查看java.util.stream.Sink接口的内部类。例如：

static abstract class ChainedReference<T, E_OUT> implements Sink<T> {
    protected final Sink<? super E_OUT> downstream;
}

1
2
3

在wrapSink()方法中会沿着流管道，从终止操作往前遍历，构筑出完整的Sink单向链表对象： (opens new window) 然后就会按顺序执行这些sink中定义的方法，处理数据源。例如java.util.stream.AbstractPipeline##copyInto：

final <P_IN> void copyInto(Sink<P_IN> wrappedSink, Spliterator<P_IN> spliterator) {
    Objects.requireNonNull(wrappedSink);

    if (!StreamOpFlag.SHORT_CIRCUIT.isKnown(getStreamAndOpFlags())) {
        wrappedSink.begin(spliterator.getExactSizeIfKnown());
        spliterator.forEachRemaining(wrappedSink);
        wrappedSink.end();
    }
    else {
        copyIntoWithCancel(wrappedSink, spliterator);
    }
}

1
2
3
4
5
6
7
8
9
10
11
12

# 5 解析数据源：Spliterator<T>分隔器

在上述讲解过程中，我们可以发现：在创建流的过程中并没有将数据源直接保存起来，而是会使用一个叫Spliterator的接口将其封装起来。这么做的原因是：数据源的格式太多，且未来可继续扩展。不可能在AbstractPipeline中针对每种数据源都进行处理，只能抽取出一个抽象层，规定了遍历元素的方法，而具体逻辑由实现类制定。我们在执行sink中定义的方法时，会调用到Spliterator的forEachRemaining()方法，它会遍历数据源，进行逻辑处理：

default void forEachRemaining(Consumer<? super T> action) {
    do { } while (tryAdvance(action));
}

1
2
3

具体如何遍历数据源和逻辑处理，要看数据源对应的Spliterator实现类。例如java.util.ArrayList.ArrayListSpliterator既重写了forEachRemaining()方法：

public void forEachRemaining(Consumer<? super E> action) {
    int i, hi, mc; // hoist accesses and checks from loop
    ArrayList<E> lst; Object[] a;
    if (action == null)
        throw new NullPointerException();
    if ((lst = list) != null && (a = lst.elementData) != null) {
        if ((hi = fence) < 0) {
            mc = lst.modCount;
            hi = lst.size;
        }
        else
            mc = expectedModCount;
        if ((i = index) >= 0 && (index = hi) <= a.length) {
            for (; i < hi; ++i) {
                @SuppressWarnings("unchecked") E e = (E) a[i];
                action.accept(e);
            }
            if (lst.modCount == mc)
                return;
        }
    }
    throw new ConcurrentModificationException();
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

也实现了tryAdvance()方法：

public boolean tryAdvance(Consumer<? super E> action) {
    if (action == null)
        throw new NullPointerException();
    int hi = getFence(), i = index;
    if (i < hi) {
        index = i + 1;
        @SuppressWarnings("unchecked") E e = (E)list.elementData[i];
        action.accept(e);
        if (list.modCount != expectedModCount)
            throw new ConcurrentModificationException();
        return true;
    }
    return false;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14

# 6 执行顺序的本质

需要注意的是，Sink<T>接口继承了Consumer<T>接口。而在中间操作中往往会按递归调用的方式实现accept()方法：

public final Stream<P_OUT> filter(Predicate<? super P_OUT> predicate) {
    Objects.requireNonNull(predicate);
    return new StatelessOp<P_OUT, P_OUT>(this, StreamShape.REFERENCE,
                                 StreamOpFlag.NOT_SIZED) {
        @Override
        Sink<P_OUT> opWrapSink(int flags, Sink<P_OUT> sink) {
            return new Sink.ChainedReference<P_OUT, P_OUT>(sink) {
                @Override
                public void begin(long size) {
                    downstream.begin(-1);
                }

                @Override
                public void accept(P_OUT u) {
                    if (predicate.test(u))
                        downstream.accept(u);
                }
            };
        }
    };
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

因此，只需要执行一次action.accept(e)，就会执行所有中间操作。此时，我们也可以发现一个很有趣的问题：流在实际执行过程中，会一次性对每个元素执行所有中间操作。伪代码如下：

// 数据源
int[] source;
// 中间操作链表
Consumer action;
for (int i = 0; i < size; ++i) {
    // 获取当前元素
    int e = source[i];
    // 一次性执行所有中间操作
    action.accept(e);
}

1
2
3
4
5
6
7
8
9
10

#java #stream

上次更新: 2023/12/29 11:32:56

← IO流函数式接口→