谈谈分组:sql的group by+聚集函数 和 python的groupby+agg

2024-09-04 07:18

本文主要是介绍谈谈分组:sql的group by+聚集函数 和 python的groupby+agg,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

直接举例子+分析例子+总结来说,我先给几个表:

学生表:student(学号,姓名,年龄,院系);
课程表:course(课程号,课程名,学分);
学生选课表:sc(学号,课程号,分数);

啥时候用分组呢?

我由简至深来谈。
1、比如让我们查询各个课程号及相应的选课人数。
首先定位到sc表上,“各个”很明显就是要按课程分组,group by出场了,分组后对每组去统计选课人数,聚集函数出场了。
聚集函数就是一些统计指标:求和最大值最小值均值方差count这些。

select 课程号,count(distinct 学号)
from  sc
group by 课程号;

2、 比如查询选修了3门以上课程的学生学号。
首先我们知道是定位到sc表上,再细读一遍这句话,是选了3门以上课程的学生,那么我们是不是要知道每一个学生选了几门呢。当我们分析出了 “每个”“各个”“每天”等 这样的字眼时,就知道要分组了,这时候group by就出场了。我们要先根据学生分组,分好后要去对每组做一个统计,统计什么,统计每组有多少课程(即每个学号下有几门课),然后过滤掉不满足统计值的组,这就要用到having子句和聚集函数了。

select 学号
from sc
order by 课程号
having count(*)>3;

3、比如查询平均成绩大于等于90分的学生学号和平均成绩。
平均成绩,知道了要用到聚集函数avg()。再细读这不是整体的平均成绩,而是每个学生的平均成绩,知道了要用分组group by。分组后,各组以一个学生为单位。大于90分的学生,知道了要过滤掉小于90分的分组,having也出场了。梳理一下,就是先要分组,分组后,对每组的成绩那列做一个avg的统计,最后用having+avg做一个过滤不合格分组。

select 学号,avg(grade) --select这里返回的avg是统计指标满足>=90的分组的
from sc
group by 学号
having avg(成绩)>=90; 

总结一下grouyp by

简单来说,就是用来分组的,同时对每个组做一些统计(聚集函数)。
细说:
group by 是这样用的。它是和聚集函数一起的。如果我们要统计每组的统计特征(求和最大最小均值方差count),我们可以用group by,再在select里面去统计。如果我们要根据每组的统计特征去筛掉一些组,我们可以用group by,再在having里面去根据统计特征的值过滤掉一些组。

python待补充
对应到python里就是表名.group by([列名]).agg(列名:聚集函数)。

这篇关于谈谈分组:sql的group by+聚集函数 和 python的groupby+agg的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1135361

相关文章

Python通用唯一标识符模块uuid使用案例详解

《Python通用唯一标识符模块uuid使用案例详解》Pythonuuid模块用于生成128位全局唯一标识符,支持UUID1-5版本,适用于分布式系统、数据库主键等场景,需注意隐私、碰撞概率及存储优... 目录简介核心功能1. UUID版本2. UUID属性3. 命名空间使用场景1. 生成唯一标识符2. 数

浅谈mysql的not exists走不走索引

《浅谈mysql的notexists走不走索引》在MySQL中,​NOTEXISTS子句是否使用索引取决于子查询中关联字段是否建立了合适的索引,下面就来介绍一下mysql的notexists走不走索... 在mysql中,​NOT EXISTS子句是否使用索引取决于子查询中关联字段是否建立了合适的索引。以下

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

Python包管理工具pip的升级指南

《Python包管理工具pip的升级指南》本文全面探讨Python包管理工具pip的升级策略,从基础升级方法到高级技巧,涵盖不同操作系统环境下的最佳实践,我们将深入分析pip的工作原理,介绍多种升级方... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式

《Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式》本文详细介绍如何使用Java通过JDBC连接MySQL数据库,包括下载驱动、配置Eclipse环境、检测数据库连接等关键步骤,... 目录一、下载驱动包二、放jar包三、检测数据库连接JavaJava 如何使用 JDBC 连接 mys

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Qt使用QSqlDatabase连接MySQL实现增删改查功能

《Qt使用QSqlDatabase连接MySQL实现增删改查功能》这篇文章主要为大家详细介绍了Qt如何使用QSqlDatabase连接MySQL实现增删改查功能,文中的示例代码讲解详细,感兴趣的小伙伴... 目录一、创建数据表二、连接mysql数据库三、封装成一个完整的轻量级 ORM 风格类3.1 表结构

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert