PostgreSQL中rank()窗口函数实用指南与示例

2025-07-11 18:50

本文主要是介绍PostgreSQL中rank()窗口函数实用指南与示例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《PostgreSQL中rank()窗口函数实用指南与示例》在数据分析和数据库管理中,经常需要对数据进行排名操作,PostgreSQL提供了强大的窗口函数rank(),可以方便地对结果集中的行进行排名...

一、rank()函数简介

rank()是一个窗口函数,用于计算结果集中每一行的排名。它的基本语法如下:

rank() OVER ([PARTITION BY partition_expression] ORDER BY order_expression)
  • PARTITION BY:可选子句,用于将结果集划分为多个分区,排名在每个分区内独立计算。
  • ORDER BY:指定排名的顺序依据。

特点

  • 相同值的行会获得相同的排名。
  • 下一个排名会跳过相同值的数量。例如,如果有两个第一名,下一个排名是第三名。

二、基础示例:部门内员工薪资排名

假设有一个employees表,包含员工姓名、部门和薪资信息。我们希望计算每个部门内员工的薪资排名。

示例数据

首先,创建示例数据:

WITH sample_data AS (
    SELECT * FROM (
        VALUES 
            ('Alice', 'Sales', 50000),
            ('Bob', 'Marketing', 55000),
            ('Charlie', 'Sales', 52000),
            ('David', 'IT', 60000),
            ('Eve', 'Marketing', 55000),
            ('Frank', 'IT', 62000)
    ) AS t(employee_name, department, salary)
)

排名查询

使用rank()函数按部门分区,按薪资降序排名:

SELECT 
    employee_name, 
    department, 
    salary, 
    RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS dept_salary_rank
FROM 
    sample_data
ORDER BY 
    department, dept_salary_rank;

结果

employee_namedepartmentsalarydept_salary_rank
FrankIT620001
DavidIT600002
BobMarketing550001
EveMarketing550001
CharlieSales520001
AliceSales500002

解释

  • 在IT部门,Frank薪资最高,排名为1;David次之,排名为2。
  • 在Marketing部门,Bob和Eve薪资相同,均排名为1。
  • 在Sales部门,Charlie薪资最高,排名为1;Alice次之,排名为2。

三、高级应用示例

1. 每组Top N记录

场景:找出每个类别中最贵的两个产品。

示例数据

WITH products AS (
    SjsELECT * FROM (
        VALUES 
            (1, 'A', 100),
            (2, 'A', 80),
            (3, 'B', 200),
            (4, 'B', 180),
            (5, 'B', 150),
   http://www.chinasem.cn         (6, 'C', 120)
    ) AS t(product_id, category, price)
)

查询

SELECT * 
FROM (
    SELECT 
        product_id, 
        category, 
        price, 
        RANK() OVER (PARTITION BY category ORDER BY price DESC) AS rank
    FROM 
        products
) ranked
WHERE rank <= 2;

结果

product_idcategorypricerank
1A1001
2A802
3B2001
4B1802
6C1201

解释

  • 每个类别中,价格最高的前两个产品被筛选出来。

2. 百分位数计算

场景:计算每个学生的成绩百分位。

示例数据

WITH scores AS (
    SELECT * FROM (
        VALUES 
            ('Student 1', 85),
            ('Student 2', 92),
            ('Student 3', 78),
            ('Student 4', 90),
            ('Student 5', 88)
    ) AS t(student, score)
)

查询

SELECT 
    student, 
    score, 
    RANK() OVER (ORDER BY score) AS rank,
    ROUND(100.0 * RANK() OVER (ORDER BY score) / (SELECT COUNT(*) FROM scores), 2) AS percentile
FROM 
    sco编程res;

结果

studentscorerankpercentile
Student 378120.00
Student 185240.00
Student 588360.00
Student 490480.00
Student 2925100.00

解释

  • 百分位数通过排名除以总记录数并乘以100计算得出。

四、rank()与其他窗口函数的比较

PostgreSQL提供了多个窗口函数用于排名,各有特点:

javascript
函数描述
rank()相同值的行获得相同排名,下一个排名跳过相同值的数量。
dense_rank()相同值的行获得相同排名,下一个排名不跳过,保持连续。
row_number()每行分配唯一的序号,不考虑相同值,即使值相同也会分配不同序号。

示例:rank() vs dense_rank()

示例数据

WITH scores AS (
    SELECT * FROM (
    mGXfcVJYe    VALUES 
            ('Player 1', 100),
            ('Player 2', 95),
            ('Player 3', 95),
            ('Player 4', 90)
    ) AS t(player, score)
)

PostgreSQL中rank()窗口函数实用指南与示例

查询

SELECT 
    player, 
    score, 
    RANK() OVER (ORDER BY score DESC) AS rank,
    DENSE_RANK() OVER (ORDER BY score DESC) AS dense_rank
FROM 
    scores;

结果

playerscorerankdense_rank
Player 110011
Player 29522
Player 39522
Player 49043

解释

  • rank()在遇到相同分数时跳过了排名3。
  • dense_rank()在遇到相同分数时不跳过排名,保持连续。

示例:row_number()

场景:为每日的销售记录分配唯一序号,按销售金额降序排列。

示例数据

WITH sales AS (
    SELECT 
        DATE '2023-01-01' AS sale_date, 
        1000 AS amount
    UNION ALL
    SELECT 
        DATE '2023-01-01', 
        1500
    UNION ALL
    SELECT 
        DATE '2023-01-02', 
        1200
    UNION ALL
    SELECT 
        DATE '2023-01-02', 
        1200
)

查询

SELECT 
    sale_date, 
    amount, 
    ROW_NUMBER() OVER (PARTITION BY sale_date ORDER BY amount DESC) AS row_num
FROM 
    sales;

结果

sale_dateamountrow_num
2023-01-0115001
2023-01-0110002
2023-01-0212001
2023-01-0212002

解释

  • 即使同一天有相同的销售金额,row_number()也会为每条记录分配唯一的序号。

五、性能优化建议

使用窗口函数如rank()时,可能会对查询性能产生影响,尤其是在处理大数据集时。以下是一些优化建议:

  1. 使用PARTITION BY合理分区:将数据划分为较小的分区,可以减少每个窗口函数计算的数据量。
  2. 指定ORDER BY明确排序:确保ORDER BY子句明确,避免全表排序带来的性能开销。
  3. 创建适当的索引:在ORDER BYPARTITION BY涉及的列上创建索引,可以加快排序和分区操作。
  4. 限制结果集:如果只需要前N条记录,结合WHERE rank <= N可以减少计算量。

六、总结

PostgreSQL的rank()窗口函数是一个强大的工具,适用于各种排名需求,如部门内薪资排名、每组Top N记录、百分位数计算等。通过合理使用rank()及其相关函数(如dense_rank()row_number()),可以高效地处理复杂的数据分析任务。

关键点回顾

  • rank()函数为相同值的行分配相同的排名,并跳过后续排名。
  • 结合PARTITION BYORDER BY,可以实现多层次的排名需求。
  • 与其他窗口函数(如dense_rank()row_number())相比,rank()在处理并列排名时有独特的行为。
  • 通过优化查询和索引,可以提升窗口函数的性能表现。

希望本文的示例和解释能帮助你在实际项目中更好地应用rank()函数,提升数据处理的效率和准确性!

到此这篇关于PostgreSQL中rank()窗口函数实用指南与示例的文章就介绍到这了,更多相关PostgreSQL rank()窗口函数内容请搜索China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程China编程(www.chinasem.cn)!

这篇关于PostgreSQL中rank()窗口函数实用指南与示例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1155367

相关文章

使用Python删除Excel中的行列和单元格示例详解

《使用Python删除Excel中的行列和单元格示例详解》在处理Excel数据时,删除不需要的行、列或单元格是一项常见且必要的操作,本文将使用Python脚本实现对Excel表格的高效自动化处理,感兴... 目录开发环境准备使用 python 删除 Excphpel 表格中的行删除特定行删除空白行删除含指定

全面掌握 SQL 中的 DATEDIFF函数及用法最佳实践

《全面掌握SQL中的DATEDIFF函数及用法最佳实践》本文解析DATEDIFF在不同数据库中的差异,强调其边界计算原理,探讨应用场景及陷阱,推荐根据需求选择TIMESTAMPDIFF或inte... 目录1. 核心概念:DATEDIFF 究竟在计算什么?2. 主流数据库中的 DATEDIFF 实现2.1

SpringBoot结合Docker进行容器化处理指南

《SpringBoot结合Docker进行容器化处理指南》在当今快速发展的软件工程领域,SpringBoot和Docker已经成为现代Java开发者的必备工具,本文将深入讲解如何将一个SpringBo... 目录前言一、为什么选择 Spring Bootjavascript + docker1. 快速部署与

MySQL中的LENGTH()函数用法详解与实例分析

《MySQL中的LENGTH()函数用法详解与实例分析》MySQLLENGTH()函数用于计算字符串的字节长度,区别于CHAR_LENGTH()的字符长度,适用于多字节字符集(如UTF-8)的数据验证... 目录1. LENGTH()函数的基本语法2. LENGTH()函数的返回值2.1 示例1:计算字符串

创建Java keystore文件的完整指南及详细步骤

《创建Javakeystore文件的完整指南及详细步骤》本文详解Java中keystore的创建与配置,涵盖私钥管理、自签名与CA证书生成、SSL/TLS应用,强调安全存储及验证机制,确保通信加密和... 目录1. 秘密键(私钥)的理解与管理私钥的定义与重要性私钥的管理策略私钥的生成与存储2. 证书的创建与

Python包管理工具pip的升级指南

《Python包管理工具pip的升级指南》本文全面探讨Python包管理工具pip的升级策略,从基础升级方法到高级技巧,涵盖不同操作系统环境下的最佳实践,我们将深入分析pip的工作原理,介绍多种升级方... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

PowerShell中15个提升运维效率关键命令实战指南

《PowerShell中15个提升运维效率关键命令实战指南》作为网络安全专业人员的必备技能,PowerShell在系统管理、日志分析、威胁检测和自动化响应方面展现出强大能力,下面我们就来看看15个提升... 目录一、PowerShell在网络安全中的战略价值二、网络安全关键场景命令实战1. 系统安全基线核查

SpringBoot线程池配置使用示例详解

《SpringBoot线程池配置使用示例详解》SpringBoot集成@Async注解,支持线程池参数配置(核心数、队列容量、拒绝策略等)及生命周期管理,结合监控与任务装饰器,提升异步处理效率与系统... 目录一、核心特性二、添加依赖三、参数详解四、配置线程池五、应用实践代码说明拒绝策略(Rejected

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Java操作Word文档的全面指南

《Java操作Word文档的全面指南》在Java开发中,操作Word文档是常见的业务需求,广泛应用于合同生成、报表输出、通知发布、法律文书生成、病历模板填写等场景,本文将全面介绍Java操作Word文... 目录简介段落页头与页脚页码表格图片批注文本框目录图表简介Word编程最重要的类是org.apach