【SQL】按字段分组查询符合条件记录的方法

2024-02-29 22:48

本文主要是介绍【SQL】按字段分组查询符合条件记录的方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


     SQL查询中经常会碰到这样一种情形:先按若干字段GROUP BY分组后,再以分组数据为基础,查询返回符合条件的记录。对于这种需求,简单情况下可以直接采用MAX/MIN函数配搭GROUP BY实现(方法一);但复杂一点的情况,则可以考虑SUBSTRING_INDEX(用法参考个人译文:http://blog.csdn.net/sweeper_freedoman/article/details/52716963)嵌套GROUP_CONCAT(用法参考个人译文:http://blog.csdn.net/sweeper_freedoman/article/details/52717263)的方法实现,即先聚合再截取(方法二)。


     如示例表“visitor_province_day”数据所示,记录游客在每个省驻留的天数。

select * from visitor_province_day;

 
+---------+-----------+-----+
| visitor | province  | day |
+---------+-----------+-----+
|       1 | 陕西省    |   5 |
|       1 | 河北省    |   2 |
|       1 | 浙江省    |   9 |
|      11 | 浙江省    |   7 |
|      11 | 江苏省    |   3 |
|      11 | 湖南省    |   1 |
|      11 | 福建省    |   4 |
|      11 | 陕西省    |   1 |
|      11 | 浙江省    |   5 |
|      11 | 广东省    |   9 |
|      11 | 陕西省    |  11 |
+---------+-----------+-----+


     如果想知道每个游客驻留天数的极大值,可以简单地采用方法一。

SELECT vpd.visitor, MAX(vpd.`day`)
FROM visitor_province_day AS vpd
GROUP BY vpd.visitor;


+---------+----------------+
| visitor | MAX(vpd.`day`) |
+---------+----------------+
|       1 |              9 |
|      11 |             11 |
+---------+----------------+


     方法一是最常见的查询需要,而且已经满足绝大多数情况下的查询需求。但是如果想知道每个游客(对于一张比较大的表)在哪两个省驻留时间最长,即分组后返回的结果多余1个(当然等于1也可以只是直接用方法一就可以了)就需要先按游客(visitor)分组,然后返回两个极大天数(day)所对应的省份(province)。首先GROUP_CONCAT聚合,结果返回游客和按照天数降序排序的省份集合。

SELECT vpd.visitor, GROUP_CONCAT(vpd.province ORDER BY vpd.day DESC)
FROM visitor_province_day AS vpd
GROUP BY vpd.visitor;


+---------+---------------------------------------------------------------------------------+
| visitor | GROUP_CONCAT(vpd.province ORDER BY vpd.day DESC)                                |
+---------+---------------------------------------------------------------------------------+
|       1 | 浙江省,陕西省,河北省                                                            |
|      11 | 陕西省,广东省,浙江省,浙江省,福建省,江苏省,陕西省,湖南省                         |
+---------+---------------------------------------------------------------------------------+

     然后通过SUBSTRING_INDEX截取省份集合里面的前两个子集就实现查询需求了。

SELECT vpd.visitor, SUBSTRING_INDEX(GROUP_CONCAT(vpd.province ORDER BY vpd.day DESC), ',', 2)
FROM visitor_province_day AS vpd
GROUP BY vpd.visitor;



+---------+---------------------------------------------------------------------------+
| visitor | SUBSTRING_INDEX(GROUP_CONCAT(vpd.province ORDER BY vpd.day DESC), ',', 2) |
+---------+---------------------------------------------------------------------------+
|       1 | 浙江省,陕西省                                                             |
|      11 | 陕西省,广东省                                                             |
+---------+---------------------------------------------------------------------------+

     实际操作中的查询需要千变万化,按具体情况修改一下查询即可。当然其实在上面的例子中也可以直接按照默认(升序)排序然后截取最后两个子集(SUBSTRING_INDEX的最后一个参数替换为“-2”),即写法是多种多样的。这里推荐按返回需要降序排列的写法:GROUP_CONCAT操作超过MySQL系统变量group_concat_max_len”以及“ max_allowed_packet的设置会发生截断的情况,所以默认(升序)排序处理可能出现隐性的查询ERROR!

SELECT vpd.visitor, SUBSTRING_INDEX(GROUP_CONCAT(vpd.province ORDER BY vpd.day), ',', -2)
FROM visitor_province_day AS vpd
GROUP BY vpd.visitor;



+---------+-----------------------------------------------------------------------+
| visitor | SUBSTRING_INDEX(GROUP_CONCAT(vpd.province ORDER BY vpd.day), ',', -2) |
+---------+-----------------------------------------------------------------------+
|       1 | 浙江省,陕西省                                                         |
|      11 | 陕西省,广东省                                                         |
+---------+-----------------------------------------------------------------------+





这篇关于【SQL】按字段分组查询符合条件记录的方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/760360

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

Python版本与package版本兼容性检查方法总结

《Python版本与package版本兼容性检查方法总结》:本文主要介绍Python版本与package版本兼容性检查方法的相关资料,文中提供四种检查方法,分别是pip查询、conda管理、PyP... 目录引言为什么会出现兼容性问题方法一:用 pip 官方命令查询可用版本方法二:conda 管理包环境方法

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

mysql8.0.43使用InnoDB Cluster配置主从复制

《mysql8.0.43使用InnoDBCluster配置主从复制》本文主要介绍了mysql8.0.43使用InnoDBCluster配置主从复制,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录1、配置Hosts解析(所有服务器都要执行)2、安装mysql shell(所有服务器都要执行)3、

JavaScript对象转数组的三种方法实现

《JavaScript对象转数组的三种方法实现》本文介绍了在JavaScript中将对象转换为数组的三种实用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录方法1:使用Object.keys()和Array.map()方法2:使用Object.entr

k8s中实现mysql主备过程详解

《k8s中实现mysql主备过程详解》文章讲解了在K8s中使用StatefulSet部署MySQL主备架构,包含NFS安装、storageClass配置、MySQL部署及同步检查步骤,确保主备数据一致... 目录一、k8s中实现mysql主备1.1 环境信息1.2 部署nfs-provisioner1.2.