【MySQL】探索 MySQL 窗口函数(Window Functions)

2024-06-03 00:20

本文主要是介绍【MySQL】探索 MySQL 窗口函数(Window Functions),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


缘分让我们相遇乱世以外
命运却要我们危难中相爱
也许未来遥远在光年之外
我愿守候未知里为你等待
我没想到为了你我能疯狂到
山崩海啸没有你根本不想逃
我的大脑为了你已经疯狂到
脉搏心跳没有你根本不重要
                     🎵 邓紫棋《光年之外》


在大数据分析和处理的过程中,我们经常需要对数据进行复杂的分析和计算。传统的 SQL 聚合函数(如 SUM, AVG, MAX, MIN 等)虽然强大,但它们在处理一些特定需求时显得力不从心,比如需要在保留行级别信息的同时进行聚合计算。这时候,窗口函数(Window Functions)便显得尤为重要。本文将深入探讨 MySQL 窗口函数的使用及其强大之处。

什么是窗口函数?

窗口函数允许我们在不改变行级别数据的前提下,执行复杂的聚合和分析操作。与传统的聚合函数不同,窗口函数不会对结果进行分组,它会为每一行返回一个值,并且这个值是基于某个“窗口”内的行计算得出的。

基本语法

窗口函数的基本语法如下:

window_function() OVER ([PARTITION BY partition_expression][ORDER BY sort_expression][frame_clause]
)

window_function(): 窗口函数的名称,例如 ROW_NUMBER(), RANK(), DENSE_RANK(), SUM(), AVG() 等。
PARTITION BY partition_expression: 可选项,定义窗口的分区。
ORDER BY sort_expression: 可选项,定义窗口的排序。
frame_clause: 可选项,定义窗口的范围。

常见的窗口函数

  1. ROW_NUMBER()
    ROW_NUMBER() 函数为结果集的每一行分配一个唯一的行号。
SELECTname,department,salary,ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS row_num
FROMemployees;

上述查询为每个部门的员工按薪资降序排列,并分配一个行号。

  1. RANK() 和 DENSE_RANK()
    RANK() 和 DENSE_RANK() 函数类似,但处理排名相同时有所不同:

RANK(): 如果有两个相同的排名,下一名的排名会跳过。
DENSE_RANK(): 如果有两个相同的排名,下一名的排名不会跳过。

SELECTname,department,salary,RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS rank,DENSE_RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS dense_rank
FROMemployees;
  1. 聚合函数作为窗口函数
    常见的聚合函数如 SUM(), AVG(), MAX(), MIN() 也可以作为窗口函数使用。
SELECTdepartment,employee,salary,SUM(salary) OVER (PARTITION BY department) AS total_salary,AVG(salary) OVER (PARTITION BY department) AS avg_salary
FROMemployees;

上述查询计算了每个部门的总薪资和平均薪资,并将结果保留在每一行。

  1. 窗口范围(Frame)
    窗口函数的强大之处还在于它可以定义窗口的范围。范围可以使用 ROWS 或 RANGE 子句定义。
SELECTemployee,sale_date,sales,SUM(sales) OVER (PARTITION BY employeeORDER BY sale_dateROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS moving_sum
FROMsales;

上述查询计算了每个员工在当前行及之前两行内的销售额的移动和。

实际案例

假设我们有一个销售数据表 sales,包含以下字段:sale_id, employee, sale_date, amount。我们希望计算每个员工的累计销售额。

CREATE TABLE sales (sale_id INT AUTO_INCREMENT PRIMARY KEY,employee VARCHAR(50),sale_date DATE,amount DECIMAL(10, 2)
);INSERT INTO sales (employee, sale_date, amount) VALUES
('Alice', '2024-01-01', 100.00),
('Alice', '2024-01-02', 200.00),
('Alice', '2024-01-03', 150.00),
('Bob', '2024-01-01', 50.00),
('Bob', '2024-01-02', 300.00),
('Bob', '2024-01-03', 200.00);SELECTemployee,sale_date,amount,SUM(amount) OVER (PARTITION BY employee ORDER BY sale_date) AS cumulative_sales
FROMsales;

查询结果如下:

+----------+------------+--------+------------------+
| employee | sale_date  | amount | cumulative_sales |
+----------+------------+--------+------------------+
| Alice    | 2024-01-01 | 100.00 |           100.00 |
| Alice    | 2024-01-02 | 200.00 |           300.00 |
| Alice    | 2024-01-03 | 150.00 |           450.00 |
| Bob      | 2024-01-01 |  50.00 |            50.00 |
| Bob      | 2024-01-02 | 300.00 |           350.00 |
| Bob      | 2024-01-03 | 200.00 |           550.00 |
+----------+------------+--------+------------------+

总结

MySQL 窗口函数为我们提供了强大的数据分析能力,允许在不改变行级别数据的情况下进行复杂的聚合和计算。通过掌握窗口函数的使用,你可以更高效地处理和分析数据,从而获得更深入的业务洞察。

无论是对每个分区的累计和,还是排名和行号的计算,窗口函数都能大显身手。希望这篇文章能帮助你更好地理解和使用 MySQL 窗口函数,让你的数据分析工作更加得心应手。

这篇关于【MySQL】探索 MySQL 窗口函数(Window Functions)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1025507

相关文章

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

MySQL中查找重复值的实现

《MySQL中查找重复值的实现》查找重复值是一项常见需求,比如在数据清理、数据分析、数据质量检查等场景下,我们常常需要找出表中某列或多列的重复值,具有一定的参考价值,感兴趣的可以了解一下... 目录技术背景实现步骤方法一:使用GROUP BY和HAVING子句方法二:仅返回重复值方法三:返回完整记录方法四:

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

从入门到精通MySQL联合查询

《从入门到精通MySQL联合查询》:本文主要介绍从入门到精通MySQL联合查询,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下... 目录摘要1. 多表联合查询时mysql内部原理2. 内连接3. 外连接4. 自连接5. 子查询6. 合并查询7. 插入查询结果摘要前面我们学习了数据库设计时要满

Python函数作用域示例详解

《Python函数作用域示例详解》本文介绍了Python中的LEGB作用域规则,详细解析了变量查找的四个层级,通过具体代码示例,展示了各层级的变量访问规则和特性,对python函数作用域相关知识感兴趣... 目录一、LEGB 规则二、作用域实例2.1 局部作用域(Local)2.2 闭包作用域(Enclos

MySQL查询JSON数组字段包含特定字符串的方法

《MySQL查询JSON数组字段包含特定字符串的方法》在MySQL数据库中,当某个字段存储的是JSON数组,需要查询数组中包含特定字符串的记录时传统的LIKE语句无法直接使用,下面小编就为大家介绍两种... 目录问题背景解决方案对比1. 精确匹配方案(推荐)2. 模糊匹配方案参数化查询示例使用场景建议性能优

mysql表操作与查询功能详解

《mysql表操作与查询功能详解》本文系统讲解MySQL表操作与查询,涵盖创建、修改、复制表语法,基本查询结构及WHERE、GROUPBY等子句,本文结合实例代码给大家介绍的非常详细,感兴趣的朋友跟随... 目录01.表的操作1.1表操作概览1.2创建表1.3修改表1.4复制表02.基本查询操作2.1 SE

MySQL中的锁机制详解之全局锁,表级锁,行级锁

《MySQL中的锁机制详解之全局锁,表级锁,行级锁》MySQL锁机制通过全局、表级、行级锁控制并发,保障数据一致性与隔离性,全局锁适用于全库备份,表级锁适合读多写少场景,行级锁(InnoDB)实现高并... 目录一、锁机制基础:从并发问题到锁分类1.1 并发访问的三大问题1.2 锁的核心作用1.3 锁粒度分

MySQL数据库中ENUM的用法是什么详解

《MySQL数据库中ENUM的用法是什么详解》ENUM是一个字符串对象,用于指定一组预定义的值,并可在创建表时使用,下面:本文主要介绍MySQL数据库中ENUM的用法是什么的相关资料,文中通过代码... 目录mysql 中 ENUM 的用法一、ENUM 的定义与语法二、ENUM 的特点三、ENUM 的用法1

MySQL count()聚合函数详解

《MySQLcount()聚合函数详解》MySQL中的COUNT()函数,它是SQL中最常用的聚合函数之一,用于计算表中符合特定条件的行数,本文给大家介绍MySQLcount()聚合函数,感兴趣的朋... 目录核心功能语法形式重要特性与行为如何选择使用哪种形式?总结深入剖析一下 mysql 中的 COUNT