Java之并行流(Parallel Stream)使用详解

2025-03-05 17:50

本文主要是介绍Java之并行流(Parallel Stream)使用详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Java之并行流(ParallelStream)使用详解》Java并行流(ParallelStream)通过多线程并行处理集合数据,利用Fork/Join框架加速计算,适用于大规模数据集和计算密集...

Java并行流(Parallel Stream)

并行流是Java 8引入的高效处理集合数据的工具,通过多线程加速计算。

以下是其核心概念、使用方法及注意事项的详细指南:

1. 核心概念与原理

  • 并行处理机制:将数据分割为多个块,利用Fork/Join框架在多个线程上并行处理,最后合并结果。
  • 默认线程池:使用ForkJoinPool.China编程commonPool(),线程数等于CPU核心数(可通过系统参数调整)。
  • 适用场景:大规模数据集、计算密集型任务(如数学运算、批量转换)。

2.China编程 创建并行流的方式

  • 直接生成:通过集合的parallelStream()方法。
  • 转换顺序流:在现有流上调用parallel()
List<Integer> list = Arrays.asList(1, 2, 3, 4);

// 方式1:直接生成并行流
Stream<Integer> parallelStream1 = list.parallelStream();

// 方式2:将顺序流转为并行
Stream<Integer> parallelStream2 = list.stream().parallel();

3. 适用场景与性能优化

推荐场景

  • 数据量大:如百万级元素的过滤、映射。
  • 计算复杂:如矩阵运算、图像处理。
  • 无状态操作:如mapfilterreduce(不依赖处理顺序或外部变量)。

性能陷阱

  • 小数据集:并行化开销(线程调度、数据分割)可能抵消收益。
  • 低耗时操作:如简单加减法,并行可能更慢。

4. 注意事项与最佳实践

避免共享可变状态

并行操作中修改共享变量会导致线程安全问题,应使用无状态操作或同步控制。

// 错误示例:线程不安全的累加
List<Integer> nums = Arrays.asList(1, 2, 3);
int[] sum = {0};
nums.parallelStream().forEach(n -> sum += n); // 结果可能错误

// 正确做法:使用归约
int safeSum = nums.parallelStream().reduce(0, Integer::sum);

谨慎使用有状态操作

sorted()distinct()在并行流中可能更耗时,需合并线程结果。

// 并行排序(可能比顺序流慢)
List<Integer> sortedList = nums.parallelStream().sorted().toList();

数据源的可拆分性

  • 高效结构ArrayList、数组(支持快速随机访问,易于分割)。
  • 低效结构LinkedListTreeSet(拆分成本高)。

顺序敏感操作

使用forEachOrdered保证顺序,但牺牲性能。

// 按顺序输出(性能低于无序操作)
list.parallelStream().forEachOrdered(System.out::编程China编程println);

配置线程池

默认线程数:

Runtime.getRuntime().availableProcessors(android)

修改全局线程数:

# JVM启动参数
-Djava.util.concurrent.ForkJoinPool.common.parallelism=8

5. 性能对比示例

// 顺序流 vs 并行流(处理1000万数据)
List<Lphpong> numbers = LongStream.rangeClosed(1, 10_000_000)
                               .boxed().collect(Collectors.toList());

// 顺序流耗时
long start = System.currentTimeMillis();
long seqSum = numbers.stream().mapToLong(n -> n * 2).sum();
System.out.println("顺序流耗时: " + (System.currentTimeMillis() - start) + "ms");

// 并行流耗时
start = System.currentTimeMillis();
long parSum = numbers.parallelStream().mapToLong(n -> n * 2).sum();
System.out.println("并行流耗时: " + (System.currentTimeMillis() - start) + "ms");

典型结果(8核CPU):

顺序流耗时: 120ms 并行流耗时: 35ms

总结

优势:简化多线程编程,提升大数据处理效率。

局限:不适合小数据量、顺序敏感或低计算量任务。

最佳实践

  • 优先处理大规模数据。
  • 避免操作共享变量。
  • 测试验证性能提升。
  • 使用forEach替代forEachOrdered除非必须保证顺序。

通过合理使用并行流,可在不增加复杂代码的情况下显著提升程序性能,但需结合场景权衡利弊。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持China编程(www.chinasem.cn)。

这篇关于Java之并行流(Parallel Stream)使用详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1153645

相关文章

MySQL 主从复制部署及验证(示例详解)

《MySQL主从复制部署及验证(示例详解)》本文介绍MySQL主从复制部署步骤及学校管理数据库创建脚本,包含表结构设计、示例数据插入和查询语句,用于验证主从同步功能,感兴趣的朋友一起看看吧... 目录mysql 主从复制部署指南部署步骤1.环境准备2. 主服务器配置3. 创建复制用户4. 获取主服务器状态5

SpringBoot中六种批量更新Mysql的方式效率对比分析

《SpringBoot中六种批量更新Mysql的方式效率对比分析》文章比较了MySQL大数据量批量更新的多种方法,指出REPLACEINTO和ONDUPLICATEKEY效率最高但存在数据风险,MyB... 目录效率比较测试结构数据库初始化测试数据批量修改方案第一种 for第二种 case when第三种

Java docx4j高效处理Word文档的实战指南

《Javadocx4j高效处理Word文档的实战指南》对于需要在Java应用程序中生成、修改或处理Word文档的开发者来说,docx4j是一个强大而专业的选择,下面我们就来看看docx4j的具体使用... 目录引言一、环境准备与基础配置1.1 Maven依赖配置1.2 初始化测试类二、增强版文档操作示例2.

一文详解如何使用Java获取PDF页面信息

《一文详解如何使用Java获取PDF页面信息》了解PDF页面属性是我们在处理文档、内容提取、打印设置或页面重组等任务时不可或缺的一环,下面我们就来看看如何使用Java语言获取这些信息吧... 目录引言一、安装和引入PDF处理库引入依赖二、获取 PDF 页数三、获取页面尺寸(宽高)四、获取页面旋转角度五、判断

Spring Boot中的路径变量示例详解

《SpringBoot中的路径变量示例详解》SpringBoot中PathVariable通过@PathVariable注解实现URL参数与方法参数绑定,支持多参数接收、类型转换、可选参数、默认值及... 目录一. 基本用法与参数映射1.路径定义2.参数绑定&nhttp://www.chinasem.cnbs

C++中assign函数的使用

《C++中assign函数的使用》在C++标准模板库中,std::list等容器都提供了assign成员函数,它比操作符更灵活,支持多种初始化方式,下面就来介绍一下assign的用法,具有一定的参考价... 目录​1.assign的基本功能​​语法​2. 具体用法示例​​​(1) 填充n个相同值​​(2)

MySql基本查询之表的增删查改+聚合函数案例详解

《MySql基本查询之表的增删查改+聚合函数案例详解》本文详解SQL的CURD操作INSERT用于数据插入(单行/多行及冲突处理),SELECT实现数据检索(列选择、条件过滤、排序分页),UPDATE... 目录一、Create1.1 单行数据 + 全列插入1.2 多行数据 + 指定列插入1.3 插入否则更

Redis中Stream详解及应用小结

《Redis中Stream详解及应用小结》RedisStreams是Redis5.0引入的新功能,提供了一种类似于传统消息队列的机制,但具有更高的灵活性和可扩展性,本文给大家介绍Redis中Strea... 目录1. Redis Stream 概述2. Redis Stream 的基本操作2.1. XADD

JAVA中安装多个JDK的方法

《JAVA中安装多个JDK的方法》文章介绍了在Windows系统上安装多个JDK版本的方法,包括下载、安装路径修改、环境变量配置(JAVA_HOME和Path),并说明如何通过调整JAVA_HOME在... 首先去oracle官网下载好两个版本不同的jdk(需要登录Oracle账号,没有可以免费注册)下载完

Spring StateMachine实现状态机使用示例详解

《SpringStateMachine实现状态机使用示例详解》本文介绍SpringStateMachine实现状态机的步骤,包括依赖导入、枚举定义、状态转移规则配置、上下文管理及服务调用示例,重点解... 目录什么是状态机使用示例什么是状态机状态机是计算机科学中的​​核心建模工具​​,用于描述对象在其生命