一文详解Java Stream的sorted自定义排序

本文主要是介绍一文详解Java Stream的sorted自定义排序，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

《一文详解JavaStream的sorted自定义排序》Javastream中的sorted方法是用于对流中的元素进行排序的方法,它可以接受一个comparator参数,用于指定排序规则,sorte...

一、sorted 操作的基础原理

Java Stream 的sorted()方法用于对流中的元素进行排序，分为两种形式：

自然排序：要求元素实现Comparable接口，调用Stream.sorted()
自定义排序：通过Comparator指定排序规则，调用Stream.sorted(Comparator)

核心特性：

有状态操作js：需缓存所有元素才能进行排序
稳定性：默认使用 TimSort 算法（归并排序变体），保证稳定排序
并行流优化：并行流使用多线程分治策略提升性能

// 自然排序示例
List<Integer> numbers = Arrays.asList(5, 3, 4, 1, 2);
List<Integer> sorted = numbers.stream()
    .sorted()  // 依赖Integer实现的Comparable接口
    .collect(Collectors.China编程toList());  // [1, 2, 3, 4, 5]
 
// 自定义排序示例
List<String> words = Arrays.asList("apple", "Banana", "cherry");
List<String> caseInsensitive = words.stream()
    .sorted(String.CASE_INSENSITIVE_ORDER)  // 忽略大小写排序
    .collect(Collectors.toList());  // [apple, Banana, cherry]

二、自定义排序的实现方式

1. Comparator 接口的 Lambda 实现

通过Comparator.comparing工厂方法简化实现：

// 按字符串长度排序
List<String> words = Arrays.asList("apple", China编程"grape", "banana");
words.stream()
    .sorted(Comparator.comparing(String::length))
    .forEach(System.out::println);  // apple → grape → banana
 
// 复杂对象多字段排序（先按年龄降序，再按姓名升序）
ListChina编程<User> users = Arrays.asList(
    new User("Alice", 25),
    new User("Bob", 20),
    new User("Charlie", 25)
);
users.stream()
    .sorted(Comparator.comparingInt(User::getAge).reversed()
        .thenComparing(User::getName))
    .forEach(u -> System.out.printf("%s: %d%n", u.getName(), u.getAge()));
/* 输出:
Alice: 25
Charlie: 25
Bob: 20
*/

2. 传统 Comparator 实现类

适用于复杂排序逻辑复用：

class UserAgeComparator implements Comparator<User> {
    @Override
    public int compare(User u1, User u2) {
        return Integer.compare(u1.getAge(), u2.getAge());
    }
}
 
// 使用自定义Comparator
users.stream()
    .sorted(new UserAgeComparator())
    .collect(Collectors.toList());

3. null 值处理

使用Comparator.nullsFirst()或nullsLast()：

List<String> wordsWithNulls = Arrays.asList("apple", null, "banana");
wordsWithNulls.stream()
    .sorted(Comparator.nullsLast(String::compareTo))
    .forEach(System.out::println);  // null → apple → banana

三、性能优化策略

1. 预排序与懒排序

对已排序的数据源，避免重复排序：

// 反例：对有序集合重复排序
List<Integer> sortedNumbers = Arrays.asList(1, 2, 3, 4, 5);
sortedNumbers.stream()
    .sorted()  // 不必要的排序操作
    .collect(Collectors.toList());
 
// 优化：确保数据源有序后直接处理

2. 基础类型流避免装箱

对大量数据，使用IntStream/LongStream减少装箱开销：

// 低效：对象流装箱
List<Integer> boxedResult = numbers.stream()
    .sorted()
    .collect(Collectors.toList());
 
// 高效：IntStream直接排序
int[] primitiveResult = numbers.stream()
    .mapToInt(Integer::intValue)
    .sorted()
    .toArray();

3. 并行流排序的分治策略

并行流排序采用平衡二叉树分治算法：

// 并行流排序示例
List<Integer> largeData = IntStream.range(0, 1000000)
    .boxed()
    .collect(Collectors.toList());
 
List<Integer> sortedParallel = largeData.parallelStream()
    .sorted()
    .collect(Collectors.toList());

性能对比（数据来源：JMH 基准测试）：

数据规模	顺序流排序时间	并行流排序时间	加速比
1 万元素	1.2ms	1.8ms	0.67x
100 万元素	120ms	75ms	1.6x
1000 万元素	1.2s	0.5s	2.4x

四、特殊场景处理

1. 局部排序（Top-K 问题）

对大数据集取 Top-K，使用PriorityQueue替代全局排序：

// 传统排序：O(n log n)
List<Integer> topKTraditional = numbers.stream()
    .sorted(Comparator.reverseorder())
    .limit(10)
    .collect(Collectors.toList());
 
// 优化：O(n log k)
PriorityQueue<Integer> heap = new PriorityQueue<>(10);
numbers.forEach(n -> {
    if (heap.size() < 10 || n > heap.peek()) {
        heap.offer(n);
        if (heap.size() > 10) heap.poll();
    }
});
List<Integer> topKOptimized = new ArrayList<>(heap);
Collections.sort(topKOptimized, Collections.reverseOrder());

2. 自定义复杂排序逻辑

通过Comparator.thenComparing()组合多个排序条件：

// 按用户年龄、性别、姓名排序
users.stream()
    .sorted(Comparator.comparingInt(User::getAge)
        .thenComparing(User::getGender)
        .thenComparing(User::getName))
    .collect(Collectors.toList());

3. 对象属性为 Optional 的排序

处理可能为空的属性：

class User {
    private Optional<Integer> age;
    // getter省略
}
 
// 按年龄排序，空值放最后
users.stream()
    .sorted(Comparator.comparing(
        u -> u.getAge().orElse(Integer.MAX_VALUE)
    ))
    .collect(Collectors.toList());

五、常见误区与避坑指南

错误使用非线程安全的 Comparator

// 错误：在并行流中使用非线程安全的Comparator
Comparator<String> unsafeComparator = new Comparator<String>() {
    private Collator collator = Collator.getInstance(Locale.CHINA);
    @Override
    public int compare(String s1, String s2) {
        return collator.compare(s1, s2);  // Collator非线程安全
    }
};
words.parallelStream().sorted(unsafeComparator);  // 可能抛出异常
 
// 正确：每次创建新的Comparator实例
words.parallelStream().sorted((s1, s2) -> 
    Collator.getInstance(Locale.CHINA).compare(s1, s2)
);

忽略排序的稳定性

// 错误假设：认为所有排序都是稳定的
List<User> users = Arrays.asList(
    new User("Alice", 25),
    new User("Bob", 25)
);
// 两次排序可能导致顺序不一致（非稳定排序算法）
users.stream()
    .sorted(Comparator.comparingInt(User::getAge))
    .collect(Collectors.toList());

过度使用 sorted 导致性能下降

// 反例：多次排序操作
users.stream()
    .sorted(Comparator.comparingInt(User::getAge))
    .filter(u -> u.getAge() > 18)
    .sorted(Comparator.comparing(User::getName))
    .collect(Collectors.toList());
 
// 优化：合并排序条件，减少排序次数
users.stream()
    .filter(u -> u.getAge() > 18)
    .sorted(Comparator.comparingInt(User::getAge)
        .thenComparing(User::getName))
    .collect(Collectors.toList());

六、性能调优实战

对 100 万随机整数排序的性能对比（单位：ms）：

排序方式	耗时	内存占用	备注
传统 Collections.sort ()	150	80MB	需完整集合加载
Stream.sorted()	180	95MB	中间操作，延迟执行
IntStream.sorted()	100	60MB	避免装箱
并行 IntStream.sorted ()	65	120MB	多核 CPU 加速