Java8新特性整理之流的介绍与使用(三)

2024-06-16 05:58

本文主要是介绍Java8新特性整理之流的介绍与使用(三),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

流是什么

官方定义:支持顺序和并行聚合操作的元素序列。

这里有几个关键词,顺序、并行、聚合、元素序列。

所谓顺序就是单线程顺序执行,并行就是多线程分解执行,聚合就是将顺序或并行执行的结果计算后得出最终结果,元素序列则是将数据源(数组,文件,集合等)流化后的数据结构。

流与集合

上面说的还是有些不明朗,下面结合Java中的集合(Collection)来进一步解释流。

Java现有的集合概念和新的流概念都提供了接口,来配合代表元素型有序值的数据接口。所
谓有序,就是说我们一般是按顺序取用值,而不是随机取用的。

举例来说,如果要观看苍老师课程,有两种方式,一种是下载到本地观看,另一种是在线观看。而下载观看的方式等待下载的时间比较长同时占用磁盘空间较大;在线观看就比较快了,可以只观看高潮部分,而且只占用很少的缓冲空间。

对比来看,苍老师课程是字节或帧的数据结构,用集合方式处理的话(下载到本地观看)需要将整个结构中的数据都计算一遍,而用流的方式处理的话(在线观看高潮部分),只需要计算某个字节(帧)范围。

区别

  • 集合是内存数据结构,可以增删元素,而流是概念上固定的数据结构,不可以增删元素,只进行计算。
  • 集合可以多次遍历,而流只能遍历一次(下一次需要从数据源再获得一个新的流)。
  • 集合使用外部迭代(如for-each),而流使用内部迭代(流内部帮你把迭代做了)。
  • 关键区别,集合是有界的,流可以是无界的。

流的操作

java.util.stream.Stream中的Stream接口定义了许多操作。它们可以分为两大类。

  • 中间操作,诸如filter或sorted等中间操作会返回另一个流,即返回值为Stream的方法。
  • 终端操作,终端操作会从流的流水线生成结果,其结果是任何不是流的值,即返回值不为Stream的方法。

使用流

流的使用一般包括三件事:
- 一个数据源(如集合)来执行一个查询;
- 一个中间操作链,形成一条流的流水线;
- 一个终端操作,执行流水线,并能生成结果。

下面介绍下流中的常用方法:

中间操作常用方法

filter方法:

接受一个返回boolean的Lambda表达式的参数,返回由流元素组成的流,该流与给定谓词匹配。

distinct方法:

返回由不同对象组成的流,内部使用对象的equals方法比较是否相同。

skip方法:

接受一个long类型的参数n,表示头n个数,返回由剩下的元素组成的流,如果流容器中的元素比n小,则返回空的流。

limit方法:

接受一个long类型的参数maxSize,表示限制的最大数量,返回一个不超过maxSize长度的流。

sorted方法:

接受一个Comparator类型的参数,表示函数引用作为参数,返回根据Comparator接口中定义的行为组成排序后的流。

map方法:

接收一个函数(方法引用)作为参数,返回一个流,由将给定函数应用于该流元素的结果组成。

终端操作常用方法

anyMatch方法:

流中是否有一个元素能匹配给定的谓词

allMatch方法:

流中的元素是否都能匹配给定的谓词。

noneMatch方法:

和allMatch相对的是noneMatch。它可以确保流中没有任何元素与给定的谓词匹配。

findAny方法:

返回当前流中的任意元素。

findFirst方法:

找到第一个元素。

forEach方法:

遍历流中的每一个元素。

collect方法:

接受一个Collectors类中的方法(收集器)作为参数,返回一个归约的结果。

collect是一个终端操作,它接受的参数是将流中元素累积到汇总结果的各种方式(称为收集器)。

reduce方法:

把一个流中的元素反复结合起来,返回一个归约的结果(将流归约成一个值)。

count方法:

返回流中的元素个数。

举个例子

前面都是理论知识,下面举个栗子:

Dish.java

public class Dish {private final String name;private final boolean vegetarian; // 是否是素食private final int calories; // 卡路里private final Type type;  // 盘子装的菜的类型public Dish(String name, boolean vegetarian, int calories, Type type) {this.name = name;this.vegetarian = vegetarian;this.calories = calories;this.type = type;}public String getName() {return name;}public boolean isVegetarian() {return vegetarian;}public int getCalories() {return calories;}public Type getType() {return type;}public enum Type {MEAT, FISH, OTHER;}
}

初始化数据:

List<Dish> menu = Arrays.asList(new Dish("pork", false, 800, Dish.Type.MEAT),new Dish("beef", false, 700, Dish.Type.MEAT),new Dish("chicken", false, 400, Dish.Type.MEAT),new Dish("french fries", true, 530, Dish.Type.OTHER),new Dish("rice", true, 350, Dish.Type.OTHER),new Dish("season fruit", true, 120, Dish.Type.OTHER),new Dish("pizza", true, 550, Dish.Type.OTHER),new Dish("prawns", false, 300, Dish.Type.FISH),new Dish("salmon", false, 450, Dish.Type.FISH));

使用:

List<String> dishes = menu.stream().filter(dish -> dish.getCalories() > 300)   // 从流中过滤元素.map(Dish::getName)                         // 提取元素.limit(3)                                   // 截断流,使其元素不超过给定的数量.collect(toList());                         // 将流转换为列表  

上面例子会取出卡路里大于300的前三个Dish的名字列表。

数值流

下面来谈谈流的特化 – 数值流

对前面Dish中的菜的卡路里求和:

int calories = menu.stream().map(Dish::getCalories).reduce(0, Integer::sum);

reduce方法第一个参数表示初始值,第二个参数代表接受两个参数的函数,Integer的sum方法接受两个参数,所以可以传递一个方法引用。

乍一看,这个方法好像没什么问题,输出结果也正确。

但你其实忽略了一个问题,map方法会返回一个Stream类型的流,其中T是引用类型,所以它有一个暗含的装箱成本,会造成性能的降低。

怎么解决上面的问题呢?

Java 8引入了三个原始类型特化流接口来解决这个问题:IntStream、DoubleStream和LongStream,分别将流中的元素特化为int、long和double,从而避免了暗含的装箱成本。每个接口都带来了进行常用数值归约的新方法,比如对数值流求和的sum,找到最大元素的max。

现在改正上面的代码:

int calories = menu.stream().mapToInt(Dish::getCalories).sum();

当然,如有你需要转换回对象流,则需要调用原始类型特化流接口的boxed方法进行装箱。

什么是并行流

并行流就是一个把内容分成多个数据块,并用不同的线程分别处理每个数据块的流。

这样一来,你就可以自动把给定操作的工作负荷分配给多核处理器的所有内核,让它们都忙起来。

可以通过对收集源调用parallelStreamparallel方法来把集合转换为并行流:

 int calories = menu.parallelStream().mapToInt(Dish::getCalories).sum();

 int calories = menu.stream().parallel().mapToInt(Dish::getCalories).sum();

下表按照可分解性总结了一些流数据源适不适于并行。

可分解性
ArrayList极佳
LinkedList
IntStream.range极佳
Stream.iterate
HashSet
TreeSet

这篇关于Java8新特性整理之流的介绍与使用(三)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1065637

相关文章

SpringBoot路径映射配置的实现步骤

《SpringBoot路径映射配置的实现步骤》本文介绍了如何在SpringBoot项目中配置路径映射,使得除static目录外的资源可被访问,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一... 目录SpringBoot路径映射补:springboot 配置虚拟路径映射 @RequestMapp

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

GSON框架下将百度天气JSON数据转JavaBean

《GSON框架下将百度天气JSON数据转JavaBean》这篇文章主要为大家详细介绍了如何在GSON框架下实现将百度天气JSON数据转JavaBean,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言一、百度天气jsON1、请求参数2、返回参数3、属性映射二、GSON属性映射实战1、类对象映

RabbitMQ 延时队列插件安装与使用示例详解(基于 Delayed Message Plugin)

《RabbitMQ延时队列插件安装与使用示例详解(基于DelayedMessagePlugin)》本文详解RabbitMQ通过安装rabbitmq_delayed_message_exchan... 目录 一、什么是 RabbitMQ 延时队列? 二、安装前准备✅ RabbitMQ 环境要求 三、安装延时队

Python ORM神器之SQLAlchemy基本使用完全指南

《PythonORM神器之SQLAlchemy基本使用完全指南》SQLAlchemy是Python主流ORM框架,通过对象化方式简化数据库操作,支持多数据库,提供引擎、会话、模型等核心组件,实现事务... 目录一、什么是SQLAlchemy?二、安装SQLAlchemy三、核心概念1. Engine(引擎)

Java Stream 并行流简介、使用与注意事项小结

《JavaStream并行流简介、使用与注意事项小结》Java8并行流基于StreamAPI,利用多核CPU提升计算密集型任务效率,但需注意线程安全、顺序不确定及线程池管理,可通过自定义线程池与C... 目录1. 并行流简介​特点:​2. 并行流的简单使用​示例:并行流的基本使用​3. 配合自定义线程池​示

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

Java Kafka消费者实现过程

《JavaKafka消费者实现过程》Kafka消费者通过KafkaConsumer类实现,核心机制包括偏移量管理、消费者组协调、批量拉取消息及多线程处理,手动提交offset确保数据可靠性,自动提交... 目录基础KafkaConsumer类分析关键代码与核心算法2.1 订阅与分区分配2.2 拉取消息2.3

SpringBoot集成XXL-JOB实现任务管理全流程

《SpringBoot集成XXL-JOB实现任务管理全流程》XXL-JOB是一款轻量级分布式任务调度平台,功能丰富、界面简洁、易于扩展,本文介绍如何通过SpringBoot项目,使用RestTempl... 目录一、前言二、项目结构简述三、Maven 依赖四、Controller 代码详解五、Service