Java之并行流(Parallel Stream)使用详解

2025-03-05 17:50

本文主要是介绍Java之并行流(Parallel Stream)使用详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Java之并行流(ParallelStream)使用详解》Java并行流(ParallelStream)通过多线程并行处理集合数据,利用Fork/Join框架加速计算,适用于大规模数据集和计算密集...

Java并行流(Parallel Stream)

并行流是Java 8引入的高效处理集合数据的工具,通过多线程加速计算。

以下是其核心概念、使用方法及注意事项的详细指南:

1. 核心概念与原理

  • 并行处理机制:将数据分割为多个块,利用Fork/Join框架在多个线程上并行处理,最后合并结果。
  • 默认线程池:使用ForkJoinPool.China编程commonPool(),线程数等于CPU核心数(可通过系统参数调整)。
  • 适用场景:大规模数据集、计算密集型任务(如数学运算、批量转换)。

2.China编程 创建并行流的方式

  • 直接生成:通过集合的parallelStream()方法。
  • 转换顺序流:在现有流上调用parallel()
List<Integer> list = Arrays.asList(1, 2, 3, 4);

// 方式1:直接生成并行流
Stream<Integer> parallelStream1 = list.parallelStream();

// 方式2:将顺序流转为并行
Stream<Integer> parallelStream2 = list.stream().parallel();

3. 适用场景与性能优化

推荐场景

  • 数据量大:如百万级元素的过滤、映射。
  • 计算复杂:如矩阵运算、图像处理。
  • 无状态操作:如mapfilterreduce(不依赖处理顺序或外部变量)。

性能陷阱

  • 小数据集:并行化开销(线程调度、数据分割)可能抵消收益。
  • 低耗时操作:如简单加减法,并行可能更慢。

4. 注意事项与最佳实践

避免共享可变状态

并行操作中修改共享变量会导致线程安全问题,应使用无状态操作或同步控制。

// 错误示例:线程不安全的累加
List<Integer> nums = Arrays.asList(1, 2, 3);
int[] sum = {0};
nums.parallelStream().forEach(n -> sum += n); // 结果可能错误

// 正确做法:使用归约
int safeSum = nums.parallelStream().reduce(0, Integer::sum);

谨慎使用有状态操作

sorted()distinct()在并行流中可能更耗时,需合并线程结果。

// 并行排序(可能比顺序流慢)
List<Integer> sortedList = nums.parallelStream().sorted().toList();

数据源的可拆分性

  • 高效结构ArrayList、数组(支持快速随机访问,易于分割)。
  • 低效结构LinkedListTreeSet(拆分成本高)。

顺序敏感操作

使用forEachOrdered保证顺序,但牺牲性能。

// 按顺序输出(性能低于无序操作)
list.parallelStream().forEachOrdered(System.out::编程China编程println);

配置线程池

默认线程数:

Runtime.getRuntime().availableProcessors(android)

修改全局线程数:

# JVM启动参数
-Djava.util.concurrent.ForkJoinPool.common.parallelism=8

5. 性能对比示例

// 顺序流 vs 并行流(处理1000万数据)
List<Lphpong> numbers = LongStream.rangeClosed(1, 10_000_000)
                               .boxed().collect(Collectors.toList());

// 顺序流耗时
long start = System.currentTimeMillis();
long seqSum = numbers.stream().mapToLong(n -> n * 2).sum();
System.out.println("顺序流耗时: " + (System.currentTimeMillis() - start) + "ms");

// 并行流耗时
start = System.currentTimeMillis();
long parSum = numbers.parallelStream().mapToLong(n -> n * 2).sum();
System.out.println("并行流耗时: " + (System.currentTimeMillis() - start) + "ms");

典型结果(8核CPU):

顺序流耗时: 120ms 并行流耗时: 35ms

总结

优势:简化多线程编程,提升大数据处理效率。

局限:不适合小数据量、顺序敏感或低计算量任务。

最佳实践

  • 优先处理大规模数据。
  • 避免操作共享变量。
  • 测试验证性能提升。
  • 使用forEach替代forEachOrdered除非必须保证顺序。

通过合理使用并行流,可在不增加复杂代码的情况下显著提升程序性能,但需结合场景权衡利弊。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持China编程(www.chinasem.cn)。

这篇关于Java之并行流(Parallel Stream)使用详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1153645

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

MyBatis常用XML语法详解

《MyBatis常用XML语法详解》文章介绍了MyBatis常用XML语法,包括结果映射、查询语句、插入语句、更新语句、删除语句、动态SQL标签以及ehcache.xml文件的使用,感兴趣的朋友跟随小... 目录1、定义结果映射2、查询语句3、插入语句4、更新语句5、删除语句6、动态 SQL 标签7、ehc

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

一篇文章彻底搞懂macOS如何决定java环境

《一篇文章彻底搞懂macOS如何决定java环境》MacOS作为一个功能强大的操作系统,为开发者提供了丰富的开发工具和框架,下面:本文主要介绍macOS如何决定java环境的相关资料,文中通过代码... 目录方法一:使用 which命令方法二:使用 Java_home工具(Apple 官方推荐)那问题来了,

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node