【MySQL】探索 MySQL 窗口函数(Window Functions)

2024-06-03 00:20

本文主要是介绍【MySQL】探索 MySQL 窗口函数(Window Functions),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


缘分让我们相遇乱世以外
命运却要我们危难中相爱
也许未来遥远在光年之外
我愿守候未知里为你等待
我没想到为了你我能疯狂到
山崩海啸没有你根本不想逃
我的大脑为了你已经疯狂到
脉搏心跳没有你根本不重要
                     🎵 邓紫棋《光年之外》


在大数据分析和处理的过程中,我们经常需要对数据进行复杂的分析和计算。传统的 SQL 聚合函数(如 SUM, AVG, MAX, MIN 等)虽然强大,但它们在处理一些特定需求时显得力不从心,比如需要在保留行级别信息的同时进行聚合计算。这时候,窗口函数(Window Functions)便显得尤为重要。本文将深入探讨 MySQL 窗口函数的使用及其强大之处。

什么是窗口函数?

窗口函数允许我们在不改变行级别数据的前提下,执行复杂的聚合和分析操作。与传统的聚合函数不同,窗口函数不会对结果进行分组,它会为每一行返回一个值,并且这个值是基于某个“窗口”内的行计算得出的。

基本语法

窗口函数的基本语法如下:

window_function() OVER ([PARTITION BY partition_expression][ORDER BY sort_expression][frame_clause]
)

window_function(): 窗口函数的名称,例如 ROW_NUMBER(), RANK(), DENSE_RANK(), SUM(), AVG() 等。
PARTITION BY partition_expression: 可选项,定义窗口的分区。
ORDER BY sort_expression: 可选项,定义窗口的排序。
frame_clause: 可选项,定义窗口的范围。

常见的窗口函数

  1. ROW_NUMBER()
    ROW_NUMBER() 函数为结果集的每一行分配一个唯一的行号。
SELECTname,department,salary,ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS row_num
FROMemployees;

上述查询为每个部门的员工按薪资降序排列,并分配一个行号。

  1. RANK() 和 DENSE_RANK()
    RANK() 和 DENSE_RANK() 函数类似,但处理排名相同时有所不同:

RANK(): 如果有两个相同的排名,下一名的排名会跳过。
DENSE_RANK(): 如果有两个相同的排名,下一名的排名不会跳过。

SELECTname,department,salary,RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS rank,DENSE_RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS dense_rank
FROMemployees;
  1. 聚合函数作为窗口函数
    常见的聚合函数如 SUM(), AVG(), MAX(), MIN() 也可以作为窗口函数使用。
SELECTdepartment,employee,salary,SUM(salary) OVER (PARTITION BY department) AS total_salary,AVG(salary) OVER (PARTITION BY department) AS avg_salary
FROMemployees;

上述查询计算了每个部门的总薪资和平均薪资,并将结果保留在每一行。

  1. 窗口范围(Frame)
    窗口函数的强大之处还在于它可以定义窗口的范围。范围可以使用 ROWS 或 RANGE 子句定义。
SELECTemployee,sale_date,sales,SUM(sales) OVER (PARTITION BY employeeORDER BY sale_dateROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS moving_sum
FROMsales;

上述查询计算了每个员工在当前行及之前两行内的销售额的移动和。

实际案例

假设我们有一个销售数据表 sales,包含以下字段:sale_id, employee, sale_date, amount。我们希望计算每个员工的累计销售额。

CREATE TABLE sales (sale_id INT AUTO_INCREMENT PRIMARY KEY,employee VARCHAR(50),sale_date DATE,amount DECIMAL(10, 2)
);INSERT INTO sales (employee, sale_date, amount) VALUES
('Alice', '2024-01-01', 100.00),
('Alice', '2024-01-02', 200.00),
('Alice', '2024-01-03', 150.00),
('Bob', '2024-01-01', 50.00),
('Bob', '2024-01-02', 300.00),
('Bob', '2024-01-03', 200.00);SELECTemployee,sale_date,amount,SUM(amount) OVER (PARTITION BY employee ORDER BY sale_date) AS cumulative_sales
FROMsales;

查询结果如下:

+----------+------------+--------+------------------+
| employee | sale_date  | amount | cumulative_sales |
+----------+------------+--------+------------------+
| Alice    | 2024-01-01 | 100.00 |           100.00 |
| Alice    | 2024-01-02 | 200.00 |           300.00 |
| Alice    | 2024-01-03 | 150.00 |           450.00 |
| Bob      | 2024-01-01 |  50.00 |            50.00 |
| Bob      | 2024-01-02 | 300.00 |           350.00 |
| Bob      | 2024-01-03 | 200.00 |           550.00 |
+----------+------------+--------+------------------+

总结

MySQL 窗口函数为我们提供了强大的数据分析能力,允许在不改变行级别数据的情况下进行复杂的聚合和计算。通过掌握窗口函数的使用,你可以更高效地处理和分析数据,从而获得更深入的业务洞察。

无论是对每个分区的累计和,还是排名和行号的计算,窗口函数都能大显身手。希望这篇文章能帮助你更好地理解和使用 MySQL 窗口函数,让你的数据分析工作更加得心应手。

这篇关于【MySQL】探索 MySQL 窗口函数(Window Functions)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1025507

相关文章

Go语言连接MySQL数据库执行基本的增删改查

《Go语言连接MySQL数据库执行基本的增删改查》在后端开发中,MySQL是最常用的关系型数据库之一,本文主要为大家详细介绍了如何使用Go连接MySQL数据库并执行基本的增删改查吧... 目录Go语言连接mysql数据库准备工作安装 MySQL 驱动代码实现运行结果注意事项Go语言执行基本的增删改查准备工作

MySQL按时间维度对亿级数据表进行平滑分表

《MySQL按时间维度对亿级数据表进行平滑分表》本文将以一个真实的4亿数据表分表案例为基础,详细介绍如何在不影响线上业务的情况下,完成按时间维度分表的完整过程,感兴趣的小伙伴可以了解一下... 目录引言一、为什么我们需要分表1.1 单表数据量过大的问题1.2 分表方案选型二、分表前的准备工作2.1 数据评估

Python中的filter() 函数的工作原理及应用技巧

《Python中的filter()函数的工作原理及应用技巧》Python的filter()函数用于筛选序列元素,返回迭代器,适合函数式编程,相比列表推导式,内存更优,尤其适用于大数据集,结合lamb... 目录前言一、基本概念基本语法二、使用方式1. 使用 lambda 函数2. 使用普通函数3. 使用 N

SQL Server 查询数据库及数据文件大小的方法

《SQLServer查询数据库及数据文件大小的方法》文章介绍了查询数据库大小的SQL方法及存储过程实现,涵盖当前数据库、所有数据库的总大小及文件明细,本文结合实例代码给大家介绍的非常详细,感兴趣的... 目录1. 直接使用SQL1.1 查询当前数据库大小1.2 查询所有数据库的大小1.3 查询每个数据库的详

MySQL中REPLACE函数与语句举例详解

《MySQL中REPLACE函数与语句举例详解》在MySQL中REPLACE函数是一个用于处理字符串的强大工具,它的主要功能是替换字符串中的某些子字符串,:本文主要介绍MySQL中REPLACE函... 目录一、REPLACE()函数语法:参数说明:功能说明:示例:二、REPLACE INTO语句语法:参数

MySQL设置密码复杂度策略的完整步骤(附代码示例)

《MySQL设置密码复杂度策略的完整步骤(附代码示例)》MySQL密码策略还可能包括密码复杂度的检查,如是否要求密码包含大写字母、小写字母、数字和特殊字符等,:本文主要介绍MySQL设置密码复杂度... 目录前言1. 使用 validate_password 插件1.1 启用 validate_passwo

MySQL 数据库表操作完全指南:创建、读取、更新与删除实战

《MySQL数据库表操作完全指南:创建、读取、更新与删除实战》本文系统讲解MySQL表的增删查改(CURD)操作,涵盖创建、更新、查询、删除及插入查询结果,也是贯穿各类项目开发全流程的基础数据交互原... 目录mysql系列前言一、Create(创建)并插入数据1.1 单行数据 + 全列插入1.2 多行数据

MySQL中优化CPU使用的详细指南

《MySQL中优化CPU使用的详细指南》优化MySQL的CPU使用可以显著提高数据库的性能和响应时间,本文为大家整理了一些优化CPU使用的方法,大家可以根据需要进行选择... 目录一、优化查询和索引1.1 优化查询语句1.2 创建和优化索引1.3 避免全表扫描二、调整mysql配置参数2.1 调整线程数2.

MySQL 临时表与复制表操作全流程案例

《MySQL临时表与复制表操作全流程案例》本文介绍MySQL临时表与复制表的区别与使用,涵盖生命周期、存储机制、操作限制、创建方法及常见问题,本文结合实例代码给大家介绍的非常详细,感兴趣的朋友跟随小... 目录一、mysql 临时表(一)核心特性拓展(二)操作全流程案例1. 复杂查询中的临时表应用2. 临时

MySQL 数据库表与查询操作实战案例

《MySQL数据库表与查询操作实战案例》本文将通过实际案例,详细介绍MySQL中数据库表的设计、数据插入以及常用的查询操作,帮助初学者快速上手,感兴趣的朋友跟随小编一起看看吧... 目录mysql 数据库表操作与查询实战案例项目一:产品相关数据库设计与创建一、数据库及表结构设计二、数据库与表的创建项目二:员