03 -描述统计学- Lesson5 电子表格3_分析数据

2023-11-06 06:20

本文主要是介绍03 -描述统计学- Lesson5 电子表格3_分析数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

03 描述统计学 Lesson5 电子表格3:分析数据

文章目录

  • 03 描述统计学 Lesson5 电子表格3:分析数据
    • 2.聚合函数
    • 4.逻辑函数:IF 函数
    • 6.逻辑函数:AND、OR、NOT
    • 7.练习:逻辑函数
    • 8.条件聚合函数
    • 9.练习:COUNTIF、SUMIF 函数
    • 10.数据透视表
    • 11.练习:数据透视表
    • 12.命名区域
    • 14.Lookup函数
    • 15.练习:VLOOKUP函数

2.聚合函数

聚合,就是把大量的数据特征用一个值来表达(Aggregation Fuction: Function that operates across a group of data resulting in a single value),有以下5个值:

  • SUM 求和
  • AVERAGE 平均数
  • MAX 最大值
  • MIN 最小值
  • MEDIAN 中值(把数据从小到大排序,排在中间的那个值)
  • STDEV 标准差(衡量每个值和平均值差异,差异越大,标准差越大)

其中 SUM 已经在前面使用过了,其他的用法和 SUM 一样。除了聚合函数,课程 1:50 开始还介绍了怎么快速建立条形图(Bar Chart):

  • 选中数据
  • ‘Insert’-‘Bar Chart’ 生成条形图
  • ‘Design’ 可以修改默认样式

4.逻辑函数:IF 函数

在这里插入图片描述

IF 是编程中通用的条件判断关键字。代表如果达到条件执行一件事,如果达不到条件则执行另一件事。参照上面的语法:

  • condition 是判断的条件
  • value if TRUE 如果判断为真(通过判断)就执行这里的语句
  • [value if FALSE] 如果判断为假(没通过判断)就执行这里的语句,注意用[ ]扩起来的意思是说,这个部分可以不写,则在判断为假的时候不执行任何操作。需要注意的是,如果省略了但条件判断为假,则会输出 False。

课程中的例子也是这样:
在这里插入图片描述

课程中的实操的例子中使用了 > 大于号作为比较运算符(Comparison Operator: Compare the relative size of equality of two values with these operators - Result is a logical value either TRUE of FALSE)。需要注意一点,比较运算符的输出为 TRUE 或 FALSE,共有以下几种:

  • Greater than 大于

  • < Less than 小于
  • = Equal 等于
  • = Greater thatn or equal 大于等于

  • <= Less than or equal 小于等于
  • <> Not equal 不等于

6.逻辑函数:AND、OR、NOT

AND 和 IF 一样是函数(函数的参数在小括弧中,Excel 中看到小括弧就是函数),是把多个条件的真假一起考虑,全部为真则输出真,否则就输出假:

` =AND(condition1,condition2,...) `

三种逻辑函数的总结:

  • AND: true if all conditions are true
  • OR: true if any condition is true
  • NOT: reverses true and false

当然,逻辑函数最常见的是和IF一起使用:

在这里插入图片描述

7.练习:逻辑函数

对于3个条件,我们来进行拆解:

  • 如果一个订单中任意一种水果的最大数量超过 10 件,A1:D1>10
  • 或订单中的总水果量超过 20 件,E1>10(注意这两个条件要用OR() 包裹起来
  • 则将其标记为 “Special Order”,否则,则标记为 “No”。用IF嵌套AND表达。

PS:出错的怎么办:

  • 公式出错的话会在单元格中出现#VALUE!
  • 同时左边出现小三角可以帮助定位错误,点击后会有提示:

在这里插入图片描述

  • 可以在其他单元格将公式进行拆分,一步一步定位错误

    • 比如所我开始写了OR(A1:A4>10)报错
    • 其实原因是不支持A1:A4这种范围的比较
    • 需要每个都比较,再用逗号分隔(测试了3次,搞定):
      在这里插入图片描述
  • 注意IF判断之后要显示的文字要用双引号扩起来

  • 当出错的时候,点击fx打开公式生成器一点一点排错很有帮助(可以看到嵌套中的结果):

在这里插入图片描述

8.条件聚合函数

将条件和聚合函数嵌套,就得到了条件聚合函数(Conditional Aggregation Function: Function that operates across a group of data with logical conditions)。

课程中的 COUNTIF 和 SUMIF 的区别是,前者是数有几个,后者是求和,扩展链接:
COUNTIF 函数
SUMIF 函数

9.练习:COUNTIF、SUMIF 函数

这节请注意 SUMIF 有3个参数:判断范围、判断条件、求和范围。另外,如果是在 MAC Office 上,所有涉及公式累的编辑和存储,建议完成后存储为 xlsx 格式,否则csv会丢失公式信息。

10.数据透视表

数据透视表是 Excel 非常强大的功能,一次输入数据,可以根据选择进行各种筛选和展示。(有点像Tableau这种敏捷BI程序,这个后续专门课程会讲)。MAC 打开数据透视表的方式是:

在这里插入图片描述

11.练习:数据透视表

数据透视表有些复杂,练习请一定要完成,练习中的计算salary的提示如下:

在这里插入图片描述

12.命名区域

MAC 和 Windows 的‘命名区域’位置相同:

在这里插入图片描述

14.Lookup函数

Lookup 是可以使用关键字在表格中查询其他信息的函数,包括LOOKUP(按行查找 Horizontal)和 VLOOKUP(按列查找 Vertical)(Lookup Function: Function that uses a keyword and index to “Look up” a value in a table.)

LOOKUP 函数

15.练习:VLOOKUP函数

练习按照 check list 分解做就可以了。注意要先创建2个‘命名区域’,再做VLOOKUP,在选择VLOOKUP的第二个参数时,就可以看到创建的 airline_lookupairport_lookup 两个参数(MAC):

在这里插入图片描述

问题提示:
Q1 伦敦:

  • 在完成 VLOOKUP 之后,使用 COUNTIF ,注意检查判断条件,题目中的 London Heathrow 的拼写和数据中是否一致。

Q2 唯一的航空公司:

  • 方法1:使用数据透视表 + COUNTA
    • 使用数据透视表可以将每个航空公司出现的次数计算出来(可以看出来那家航空公司的飞行的次数比较多):
      在这里插入图片描述
    • 对输出结果用 COUNTA 函数计算值的数量
  • 方法2:高级过滤 + COUNTA
    • 使用‘高级过滤’将独特的数据过滤出来到新的位置(图中的例子是数不同的目的地机场,请同学们理解后自己完成不同航空公司的问题):
      在这里插入图片描述
    • 对输出结果用 COUNTA 函数计算值的数量
    • 这种方式的区别是所有非独特值都依次有输出,可以copy文字道别的地方使用(比如word的报告中)

Q3 航线第二多的航空公司:

  • 在Q2的生成的数据透视表中,进行排序。MAC的操作提示如下:
    在这里插入图片描述

这篇关于03 -描述统计学- Lesson5 电子表格3_分析数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/354927

相关文章

Linux中的HTTPS协议原理分析

《Linux中的HTTPS协议原理分析》文章解释了HTTPS的必要性:HTTP明文传输易被篡改和劫持,HTTPS通过非对称加密协商对称密钥、CA证书认证和混合加密机制,有效防范中间人攻击,保障通信安全... 目录一、什么是加密和解密?二、为什么需要加密?三、常见的加密方式3.1 对称加密3.2非对称加密四、

MySQL中读写分离方案对比分析与选型建议

《MySQL中读写分离方案对比分析与选型建议》MySQL读写分离是提升数据库可用性和性能的常见手段,本文将围绕现实生产环境中常见的几种读写分离模式进行系统对比,希望对大家有所帮助... 目录一、问题背景介绍二、多种解决方案对比2.1 原生mysql主从复制2.2 Proxy层中间件:ProxySQL2.3

SpringBoot集成EasyExcel实现百万级别的数据导入导出实践指南

《SpringBoot集成EasyExcel实现百万级别的数据导入导出实践指南》本文将基于开源项目springboot-easyexcel-batch进行解析与扩展,手把手教大家如何在SpringBo... 目录项目结构概览核心依赖百万级导出实战场景核心代码效果百万级导入实战场景监听器和Service(核心

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

pandas数据的合并concat()和merge()方式

《pandas数据的合并concat()和merge()方式》Pandas中concat沿轴合并数据框(行或列),merge基于键连接(内/外/左/右),concat用于纵向或横向拼接,merge用于... 目录concat() 轴向连接合并(1) join='outer',axis=0(2)join='o

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.