【SQL】一条查询中统计同一字段不同记录值数量(频数统计)的写法

本文主要是介绍【SQL】一条查询中统计同一字段不同记录值数量(频数统计)的写法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

更新一:

有一些参考者反馈文中“COUNT写法”的可用性问题,这里就在文首提前聊一个概念性问题。众所周知,关系型数据库思想和SQL规范都源自IBM。然后基于(并非完全遵守)关系型数据库的理论思想和SQL标准,很多商业版或社区开源版的关系型数据库软件产品出现了。其中商业版比较知名的有IBM的DB2、Oracle的Oracle以及Microsoft的SQL Server;开源免费版比较流行的有MySQL(现在也属于Oracle公司)/MariaDB(MySQL被Oracle化后的新分支)、PostgreSQL、SQLite。虽然这些RDBMS产品都是关系型,并且支持SQL,但是每种产品的实现都是不同的,对SQL标准的支持也是不一样的。即便是同一个数据库产品,当进行过一些比较大的版本更新后,其设计和实现也可能会焕然一新。所以,也就是要有——数据库与数据库之间以及数据库版本与版本之间差异性——的概念。下文内容整理自第三版《高性能MySQL》,主要基于MySQL5.5而写,而个人举的游客数据示例查询,印象中是在MySQL5.6和5.7版本都测试过的。所以如果使用其他数据库产品、甚至是示例用MySQL但是其他比较旧的或者久远的将来很新的版本,当查询出现不适用的情况时,要将其看作是一件再正常不过的事情。


     SQL查询中经常会碰到需要在一条语句中统计某字段中不同记录值的数量,即频数统计。在看《高性能MySQL》(https://book.douban.com/subject/23008813/)这本“葵花宝典”时看到里面总结了两种方法,我在这里再整理记录一下:一种是“SUM”法;另一种是“COUNT”法。

 

     如示例表“visitor_province_day”数据所示,记录游客在每个省驻留的天数。现在想知道若干省份(如“陕西省”和“浙江省”)被游客游览的次数,就可以直接计数它们的记录数来进行统计。

mysql> select * from visitor_province_day;
+---------+-----------+-----+
| visitor | province  | day |
+---------+-----------+-----+
|       1 | 陕西省    |   5 |
|       1 | 河北省    |   2 |
|       1 | 浙江省    |   9 |
|      11 | 浙江省    |   7 |
|      11 | 江苏省    |   3 |
|      11 | 湖南省    |   1 |
|      11 | 福建省    |   4 |
|      11 | 陕西省    |   1 |
|      11 | 浙江省    |   5 |
|      11 | 广东省    |   9 |
|      11 | 陕西省    |  11 |
+---------+-----------+-----+

     “SUM”写法。

SELECT SUM(IF(vpd.province = '陕西省', 1, 0)) AS cnt_sx, SUM(IF(vpd.province = '浙江省', 1, 0)) AS cnt_zj
FROM visitor_province_day AS vpd;

 

+--------+--------+
| cnt_sx | cnt_zj |
+--------+--------+
|      3 |      3 |
+--------+--------+

     “COUNT”写法。

SELECT COUNT(vpd.province = '陕西省' OR NULL) AS cnt_sx, COUNT(vpd.province = '浙江省' OR NULL) AS cnt_zj
FROM visitor_province_day AS vpd;

 

+--------+--------+
| cnt_sx | cnt_zj |
+--------+--------+
|      3 |      3 |
+--------+--------+

     由结果可以看出样本中两个省份的频次是一样的,都是3次。如果要进行多个匹配,把“=”改成“IN”列表的形式就可以了,如IN('陕西省', '浙江省')。更甚,也可以把等号替换成“LIKE”或者“REGEXP”模糊匹配噢!

这篇关于【SQL】一条查询中统计同一字段不同记录值数量(频数统计)的写法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/760361

相关文章

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

SpringBoot实现不同接口指定上传文件大小的具体步骤

《SpringBoot实现不同接口指定上传文件大小的具体步骤》:本文主要介绍在SpringBoot中通过自定义注解、AOP拦截和配置文件实现不同接口上传文件大小限制的方法,强调需设置全局阈值远大于... 目录一  springboot实现不同接口指定文件大小1.1 思路说明1.2 工程启动说明二 具体实施2

MySQL中On duplicate key update的实现示例

《MySQL中Onduplicatekeyupdate的实现示例》ONDUPLICATEKEYUPDATE是一种MySQL的语法,它在插入新数据时,如果遇到唯一键冲突,则会执行更新操作,而不是抛... 目录1/ ON DUPLICATE KEY UPDATE的简介2/ ON DUPLICATE KEY UP

MySQL分库分表的实践示例

《MySQL分库分表的实践示例》MySQL分库分表适用于数据量大或并发压力高的场景,核心技术包括水平/垂直分片和分库,需应对分布式事务、跨库查询等挑战,通过中间件和解决方案实现,最佳实践为合理策略、备... 目录一、分库分表的触发条件1.1 数据量阈值1.2 并发压力二、分库分表的核心技术模块2.1 水平分

Python与MySQL实现数据库实时同步的详细步骤

《Python与MySQL实现数据库实时同步的详细步骤》在日常开发中,数据同步是一项常见的需求,本篇文章将使用Python和MySQL来实现数据库实时同步,我们将围绕数据变更捕获、数据处理和数据写入这... 目录前言摘要概述:数据同步方案1. 基本思路2. mysql Binlog 简介实现步骤与代码示例1

使用shardingsphere实现mysql数据库分片方式

《使用shardingsphere实现mysql数据库分片方式》本文介绍如何使用ShardingSphere-JDBC在SpringBoot中实现MySQL水平分库,涵盖分片策略、路由算法及零侵入配置... 目录一、ShardingSphere 简介1.1 对比1.2 核心概念1.3 Sharding-Sp

Java实现复杂查询优化的7个技巧小结

《Java实现复杂查询优化的7个技巧小结》在Java项目中,复杂查询是开发者面临的“硬骨头”,本文将通过7个实战技巧,结合代码示例和性能对比,手把手教你如何让复杂查询变得优雅,大家可以根据需求进行选择... 目录一、复杂查询的痛点:为何你的代码“又臭又长”1.1冗余变量与中间状态1.2重复查询与性能陷阱1.

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

Mac电脑如何通过 IntelliJ IDEA 远程连接 MySQL

《Mac电脑如何通过IntelliJIDEA远程连接MySQL》本文详解Mac通过IntelliJIDEA远程连接MySQL的步骤,本文通过图文并茂的形式给大家介绍的非常详细,感兴趣的朋友跟... 目录MAC电脑通过 IntelliJ IDEA 远程连接 mysql 的详细教程一、前缀条件确认二、打开 ID