《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》

2024-08-28 13:58

本文主要是介绍《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       第9课 汇总数据
       用过excel的对这个知识点理解起来就毫不费力了,excel里面有很多统计类的汇总函数,同样sql里面也有,也就是对某些行运行聚集函数,计算并返回一个值。sql主要有以下聚集函数:avg(),count(),max(),min(),sum(),看到函数名,基本也就知道是做什么的了,比如:select avg(price) as avg_price from products; 这就是返回products表中所有产品的平均价格。而count()函数是统计表中行的数目,这里面有一个需要注意的点,那就是count(*)统计范围比较广,即使表中某一行包含空值,也会被统计,而count(column_name)统计指定列行数时,会忽略为空的行。而我们实际工作中还有一种形式用的较多,那就是count(1),很多资料说count(1)比count(*)效率高,但是实际我没有具体对比过,不同的dbms估计也会有一些差异,在mysql下,我一般用count(1)比较多些。后面的几个聚集函数不做过多赘述了,实在比较简单,使用时注意一下min()/max()/sum()是都忽略空行数据的。如果想聚集不同的值,则需要使用distinct关键字去重。这里面在提一下,以前说过sql中不写复杂业务逻辑,可以使用简单的聚集函数,因为如果把数据查出来,自己在客户端汇总、计算,比如取平均,实际效率远没有sql的avg()函数高。

       第10课 分组数据
       分组主要使用group by子句,使用分组可以将数据分为多个逻辑组,对每个组进行聚集计算。比如:select vend_id, count(*) from products group by vend_id;执行该sql,就会先将所有数据按照vend_id分组,然后计算每个组行数。分组功能很强大,一条语句可以简化非常多的业务代码逻辑,但是使用分组时还是有很多条条框框需要注意:
       (1)除聚集计算语句外,select中的每一列都必须在group by子句中给出。这句话信息量比较大,首先group by分组时,后面可以跟任意数目列,也就是group by a,b,c,d 都行,由于多个列组合分组,那么分出的组将会非常多,也会更细致。其次,查询出来的列,也就是select后面跟的列,除了聚集函数外,实际是固定的,也就是group by a, b,那么select a, b, c, count(1),多出一个c字段将导致sql语句报错,无法编译。简言之,select什么,就要group by什么,除了聚集函数,其他字段一一对应。
       (2)如果分组中包含null值的行,则将null值作为一个分组返回,也就是该列中所有null值将被分到一组。
       (3)group by子句必须出现在where子句之后,order by子句之前。这里对该子句位置做了限定,位置不对,同样无法编译通过。
       过滤分组:
       如果分组后,组数很多,数据量仍然很大,想要过滤一些数据怎么办?可以使用having子句,这里不得不提where,这两个子句都是过滤数据,where是行级过滤,而having是分组过滤。也就是说where所处理的对象是行,在数据分组前就已经起作用了,已经把数据过滤了,having所处理的对象是分组,需要数据分组后才能起相应的作用。
比如:select vend_id, count(1) from products where price>=4 group by vend_id having count(1)>=2; 很明显,where子句先筛选出所有price大于等于4的行,然后按照vend_id分组数据,最后在筛选出所有组内数目大于等于2的数据,这样对where和having的用法和区别就比较清晰了。

       分组和排序:
       用group by分组的数据是以分组顺序输出的,但未必是你所需要的排序顺序,可以结合order by子句,对分组结果进行排序输出。前面已经说了这两个子句的位置,order by位于最后。比如:select order_num, count(1) as items from OrderItems group by order_num having count(1) >=3 order by items, order_num desc; 比较简单,就是分组、过滤、排序,很好理解。很多时候就是一开始觉得难理解,看几次、混个脸熟、再看几次,就简单了。

       第11课 使用子查询
       子查询可以理解为查询中的查询,一般使用场景是用于where子句的in操作符,为什么这么说呢,因为子查询的select语句只能查询单个列,查询出来的单个列可以做上一级查询in操作符的过滤条件。比如:select cust_id from orders where order_num in (select order_num from OrderItems where prod_id='A001');执行时,将从内向外执行,也就是子查询先执行,返回查询结果,然后父查询在接着执行,最后输出结果。但不得不说包含子查询的sql语句阅读和调试比较复杂,性能也不高,工作中还是尽量少用。

这篇关于《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1114958

相关文章

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

MyBatis分页查询实战案例完整流程

《MyBatis分页查询实战案例完整流程》MyBatis是一个强大的Java持久层框架,支持自定义SQL和高级映射,本案例以员工工资信息管理为例,详细讲解如何在IDEA中使用MyBatis结合Page... 目录1. MyBATis框架简介2. 分页查询原理与应用场景2.1 分页查询的基本原理2.1.1 分

Spring Security简介、使用与最佳实践

《SpringSecurity简介、使用与最佳实践》SpringSecurity是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架,本文给大家介绍SpringSec... 目录一、如何理解 Spring Security?—— 核心思想二、如何在 Java 项目中使用?——

springboot中使用okhttp3的小结

《springboot中使用okhttp3的小结》OkHttp3是一个JavaHTTP客户端,可以处理各种请求类型,比如GET、POST、PUT等,并且支持高效的HTTP连接池、请求和响应缓存、以及异... 在 Spring Boot 项目中使用 OkHttp3 进行 HTTP 请求是一个高效且流行的方式。

MySQL的JDBC编程详解

《MySQL的JDBC编程详解》:本文主要介绍MySQL的JDBC编程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、前置知识1. 引入依赖2. 认识 url二、JDBC 操作流程1. JDBC 的写操作2. JDBC 的读操作总结前言本文介绍了mysq

java.sql.SQLTransientConnectionException连接超时异常原因及解决方案

《java.sql.SQLTransientConnectionException连接超时异常原因及解决方案》:本文主要介绍java.sql.SQLTransientConnectionExcep... 目录一、引言二、异常信息分析三、可能的原因3.1 连接池配置不合理3.2 数据库负载过高3.3 连接泄漏

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定