一文详解Java Stream的sorted自定义排序

2025-06-22 17:50

本文主要是介绍一文详解Java Stream的sorted自定义排序,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《一文详解JavaStream的sorted自定义排序》Javastream中的sorted方法是用于对流中的元素进行排序的方法,它可以接受一个comparator参数,用于指定排序规则,sorte...

一、sorted 操作的基础原理

Java Stream 的sorted()方法用于对流中的元素进行排序,分为两种形式:

  • 自然排序:要求元素实现Comparable接口,调用Stream.sorted()
  • 自定义排序:通过Comparator指定排序规则,调用Stream.sorted(Comparator)

核心特性

  • 有状态操作js:需缓存所有元素才能进行排序
  • 稳定性:默认使用 TimSort 算法(归并排序变体),保证稳定排序
  • 并行流优化:并行流使用多线程分治策略提升性能
// 自然排序示例
List<Integer> numbers = Arrays.asList(5, 3, 4, 1, 2);
List<Integer> sorted = numbers.stream()
    .sorted()  // 依赖Integer实现的Comparable接口
    .collect(Collectors.China编程toList());  // [1, 2, 3, 4, 5]
 
// 自定义排序示例
List<String> words = Arrays.asList("apple", "Banana", "cherry");
List<String> caseInsensitive = words.stream()
    .sorted(String.CASE_INSENSITIVE_ORDER)  // 忽略大小写排序
    .collect(Collectors.toList());  // [apple, Banana, cherry]

二、自定义排序的实现方式

1. Comparator 接口的 Lambda 实现

通过Comparator.comparing工厂方法简化实现:

// 按字符串长度排序
List<String> words = Arrays.asList("apple", China编程"grape", "banana");
words.stream()
    .sorted(Comparator.comparing(String::length))
    .forEach(System.out::println);  // apple → grape → banana
 
// 复杂对象多字段排序(先按年龄降序,再按姓名升序)
ListChina编程<User> users = Arrays.asList(
    new User("Alice", 25),
    new User("Bob", 20),
    new User("Charlie", 25)
);
users.stream()
    .sorted(Comparator.comparingInt(User::getAge).reversed()
        .thenComparing(User::getName))
    .forEach(u -> System.out.printf("%s: %d%n", u.getName(), u.getAge()));
/* 输出:
Alice: 25
Charlie: 25
Bob: 20
*/

2. 传统 Comparator 实现类

适用于复杂排序逻辑复用:

class UserAgeComparator implements Comparator<User> {
    @Override
    public int compare(User u1, User u2) {
        return Integer.compare(u1.getAge(), u2.getAge());
    }
}
 
// 使用自定义Comparator
users.stream()
    .sorted(new UserAgeComparator())
    .collect(Collectors.toList());

3. null 值处理

使用Comparator.nullsFirst()nullsLast()

List<String> wordsWithNulls = Arrays.asList("apple", null, "banana");
wordsWithNulls.stream()
    .sorted(Comparator.nullsLast(String::compareTo))
    .forEach(System.out::println);  // null → apple → banana

三、性能优化策略

1. 预排序与懒排序

对已排序的数据源,避免重复排序:

// 反例:对有序集合重复排序
List<Integer> sortedNumbers = Arrays.asList(1, 2, 3, 4, 5);
sortedNumbers.stream()
    .sorted()  // 不必要的排序操作
    .collect(Collectors.toList());
 
// 优化:确保数据源有序后直接处理

2. 基础类型流避免装箱

对大量数据,使用IntStream/LongStream减少装箱开销:

// 低效:对象流装箱
List<Integer> boxedResult = numbers.stream()
    .sorted()
    .collect(Collectors.toList());
 
// 高效:IntStream直接排序
int[] primitiveResult = numbers.stream()
    .mapToInt(Integer::intValue)
    .sorted()
    .toArray();

3. 并行流排序的分治策略

并行流排序采用平衡二叉树分治算法:

// 并行流排序示例
List<Integer> largeData = IntStream.range(0, 1000000)
    .boxed()
    .collect(Collectors.toList());
 
List<Integer> sortedParallel = largeData.parallelStream()
    .sorted()
    .collect(Collectors.toList());

性能对比(数据来源:JMH 基准测试):

数据规模顺序流排序时间并行流排序时间加速比
1 万元素1.2ms1.8ms0.67x
100 万元素120ms75ms1.6x
1000 万元素1.2s0.5s2.4x

四、特殊场景处理

1. 局部排序(Top-K 问题)

对大数据集取 Top-K,使用PriorityQueue替代全局排序:

// 传统排序:O(n log n)
List<Integer> topKTraditional = numbers.stream()
    .sorted(Comparator.reverseorder())
    .limit(10)
    .collect(Collectors.toList());
 
// 优化:O(n log k)
PriorityQueue<Integer> heap = new PriorityQueue<>(10);
numbers.forEach(n -> {
    if (heap.size() < 10 || n > heap.peek()) {
        heap.offer(n);
        if (heap.size() > 10) heap.poll();
    }
});
List<Integer> topKOptimized = new ArrayList<>(heap);
Collections.sort(topKOptimized, Collections.reverseOrder());

2. 自定义复杂排序逻辑

通过Comparator.thenComparing()组合多个排序条件:

// 按用户年龄、性别、姓名排序
users.stream()
    .sorted(Comparator.comparingInt(User::getAge)
        .thenComparing(User::getGender)
        .thenComparing(User::getName))
    .collect(Collectors.toList());

3. 对象属性为 Optional 的排序

处理可能为空的属性:

class User {
    private Optional<Integer> age;
    // getter省略
}
 
// 按年龄排序,空值放最后
users.stream()
    .sorted(Comparator.comparing(
        u -> u.getAge().orElse(Integer.MAX_VALUE)
    ))
    .collect(Collectors.toList());

五、常见误区与避坑指南

错误使用非线程安全的 Comparator

// 错误:在并行流中使用非线程安全的Comparator
Comparator<String> unsafeComparator = new Comparator<String>() {
    private Collator collator = Collator.getInstance(Locale.CHINA);
    @Override
    public int compare(String s1, String s2) {
        return collator.compare(s1, s2);  // Collator非线程安全
    }
};
words.parallelStream().sorted(unsafeComparator);  // 可能抛出异常
 
// 正确:每次创建新的Comparator实例
words.parallelStream().sorted((s1, s2) -> 
    Collator.getInstance(Locale.CHINA).compare(s1, s2)
);

忽略排序的稳定性

// 错误假设:认为所有排序都是稳定的
List<User> users = Arrays.asList(
    new User("Alice", 25),
    new User("Bob", 25)
);
// 两次排序可能导致顺序不一致(非稳定排序算法)
users.stream()
    .sorted(Comparator.comparingInt(User::getAge))
    .collect(Collectors.toList());

过度使用 sorted 导致性能下降

// 反例:多次排序操作
users.stream()
    .sorted(Comparator.comparingInt(User::getAge))
    .filter(u -> u.getAge() > 18)
    .sorted(Comparator.comparing(User::getName))
    .collect(Collectors.toList());
 
// 优化:合并排序条件,减少排序次数
users.stream()
    .filter(u -> u.getAge() > 18)
    .sorted(Comparator.comparingInt(User::getAge)
        .thenComparing(User::getName))
    .collect(Collectors.toList());

六、性能调优实战

对 100 万随机整数排序的性能对比(单位:ms):

排序方式耗时内存占用备注
传统 Collections.sort ()15080MB需完整集合加载
Stream.sorted()18095MB中间操作,延迟执行
IntStream.sorted()10060MB避免装箱
并行 IntStream.sorted ()65120MB多核 CPU 加速

总结

Java Stream 的sorted操作提供了灵活的自定义排序能力js,但使用时需注意:

  • 基础实现:通过Comparator接口定义排序规则,支持链式组合;
  • 性能优化:优先使用基础类型流,合理选择并行流,避免重复排序;
  • 特殊场景:处理 null 值、局部排序、Optional 属性时需定制逻辑;
  • 避坑指南:注意排序稳定性、线程安全及内存占用。

理解排序操作的底层实现(TimSort 算法)和性能特性,能帮助开发者在实际应用中做出更优选择。在处理大规模数据时,建议结合数据特性(如有序度)和硬件环境(如 CPU 核心数)进行针对性优化,以达到最佳性能。

以上就是一文详解Java Stream的sorted自定义排序的详细内容,更多关于Java Stream sorted自定义排序的资料请关注编程China编程(www.chinasem.cn)其它相关文章!

这篇关于一文详解Java Stream的sorted自定义排序的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1155174

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

MyBatis常用XML语法详解

《MyBatis常用XML语法详解》文章介绍了MyBatis常用XML语法,包括结果映射、查询语句、插入语句、更新语句、删除语句、动态SQL标签以及ehcache.xml文件的使用,感兴趣的朋友跟随小... 目录1、定义结果映射2、查询语句3、插入语句4、更新语句5、删除语句6、动态 SQL 标签7、ehc

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

一篇文章彻底搞懂macOS如何决定java环境

《一篇文章彻底搞懂macOS如何决定java环境》MacOS作为一个功能强大的操作系统,为开发者提供了丰富的开发工具和框架,下面:本文主要介绍macOS如何决定java环境的相关资料,文中通过代码... 目录方法一:使用 which命令方法二:使用 Java_home工具(Apple 官方推荐)那问题来了,

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置