《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》

2024-08-28 13:58

本文主要是介绍《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       第9课 汇总数据
       用过excel的对这个知识点理解起来就毫不费力了,excel里面有很多统计类的汇总函数,同样sql里面也有,也就是对某些行运行聚集函数,计算并返回一个值。sql主要有以下聚集函数:avg(),count(),max(),min(),sum(),看到函数名,基本也就知道是做什么的了,比如:select avg(price) as avg_price from products; 这就是返回products表中所有产品的平均价格。而count()函数是统计表中行的数目,这里面有一个需要注意的点,那就是count(*)统计范围比较广,即使表中某一行包含空值,也会被统计,而count(column_name)统计指定列行数时,会忽略为空的行。而我们实际工作中还有一种形式用的较多,那就是count(1),很多资料说count(1)比count(*)效率高,但是实际我没有具体对比过,不同的dbms估计也会有一些差异,在mysql下,我一般用count(1)比较多些。后面的几个聚集函数不做过多赘述了,实在比较简单,使用时注意一下min()/max()/sum()是都忽略空行数据的。如果想聚集不同的值,则需要使用distinct关键字去重。这里面在提一下,以前说过sql中不写复杂业务逻辑,可以使用简单的聚集函数,因为如果把数据查出来,自己在客户端汇总、计算,比如取平均,实际效率远没有sql的avg()函数高。

       第10课 分组数据
       分组主要使用group by子句,使用分组可以将数据分为多个逻辑组,对每个组进行聚集计算。比如:select vend_id, count(*) from products group by vend_id;执行该sql,就会先将所有数据按照vend_id分组,然后计算每个组行数。分组功能很强大,一条语句可以简化非常多的业务代码逻辑,但是使用分组时还是有很多条条框框需要注意:
       (1)除聚集计算语句外,select中的每一列都必须在group by子句中给出。这句话信息量比较大,首先group by分组时,后面可以跟任意数目列,也就是group by a,b,c,d 都行,由于多个列组合分组,那么分出的组将会非常多,也会更细致。其次,查询出来的列,也就是select后面跟的列,除了聚集函数外,实际是固定的,也就是group by a, b,那么select a, b, c, count(1),多出一个c字段将导致sql语句报错,无法编译。简言之,select什么,就要group by什么,除了聚集函数,其他字段一一对应。
       (2)如果分组中包含null值的行,则将null值作为一个分组返回,也就是该列中所有null值将被分到一组。
       (3)group by子句必须出现在where子句之后,order by子句之前。这里对该子句位置做了限定,位置不对,同样无法编译通过。
       过滤分组:
       如果分组后,组数很多,数据量仍然很大,想要过滤一些数据怎么办?可以使用having子句,这里不得不提where,这两个子句都是过滤数据,where是行级过滤,而having是分组过滤。也就是说where所处理的对象是行,在数据分组前就已经起作用了,已经把数据过滤了,having所处理的对象是分组,需要数据分组后才能起相应的作用。
比如:select vend_id, count(1) from products where price>=4 group by vend_id having count(1)>=2; 很明显,where子句先筛选出所有price大于等于4的行,然后按照vend_id分组数据,最后在筛选出所有组内数目大于等于2的数据,这样对where和having的用法和区别就比较清晰了。

       分组和排序:
       用group by分组的数据是以分组顺序输出的,但未必是你所需要的排序顺序,可以结合order by子句,对分组结果进行排序输出。前面已经说了这两个子句的位置,order by位于最后。比如:select order_num, count(1) as items from OrderItems group by order_num having count(1) >=3 order by items, order_num desc; 比较简单,就是分组、过滤、排序,很好理解。很多时候就是一开始觉得难理解,看几次、混个脸熟、再看几次,就简单了。

       第11课 使用子查询
       子查询可以理解为查询中的查询,一般使用场景是用于where子句的in操作符,为什么这么说呢,因为子查询的select语句只能查询单个列,查询出来的单个列可以做上一级查询in操作符的过滤条件。比如:select cust_id from orders where order_num in (select order_num from OrderItems where prod_id='A001');执行时,将从内向外执行,也就是子查询先执行,返回查询结果,然后父查询在接着执行,最后输出结果。但不得不说包含子查询的sql语句阅读和调试比较复杂,性能也不高,工作中还是尽量少用。

这篇关于《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1114958

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV(使用 StorageClass)创建 StorageClass2.创建 PV

Redis 基本数据类型和使用详解

《Redis基本数据类型和使用详解》String是Redis最基本的数据类型,一个键对应一个值,它的功能十分强大,可以存储字符串、整数、浮点数等多种数据格式,本文给大家介绍Redis基本数据类型和... 目录一、Redis 入门介绍二、Redis 的五大基本数据类型2.1 String 类型2.2 Hash

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)