【数据分析】数据的离中趋势之二 - 方差和标准差、离散系数

2024-08-20 18:28

本文主要是介绍【数据分析】数据的离中趋势之二 - 方差和标准差、离散系数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

四、方差和标准差

  • 方差是数据组中各数据值与其算术平均数离差平方的算术平均数。
  • 方差的平方根就是标准差
  • 标准差的本质与平均差基本相同,平均差取绝对值的方法消除离差正负号后用算数平均的方法求平均离差。标准差用平方的方法消除离差的正负号后用离差平方求平均数再开根号。
  • 标准差的性质:
    • 标准差度量了偏离平均数的大小
    • 标准差是一类平均偏差
    • 数列大多数项距离平均数少于1个标准差范围内,极少数项距离平均数 2个 或者 3个标准差以上。

两组工人日产量标准差计算如下:

甲   组乙   组
日产量离差离差平方日产量离差离差平方
xx - 平均数(x - 平均数) 的平方xx - 平均数(x - 平均数) 的平方
4-121447-981
7-98112-416
11-52514-24
14-2414-24
14-2415-11
16001711
17111711
248641939
2598120416
281214425981
合计---548合计---214
  • 甲组方差 = 甲组离差平方的平均值 = 548 / 10 = 54.8
  • 甲组标准差 = 7.40 (件)
  • 乙组方差 = 乙组离差平方的平均值 = 214 / 10 = 21.4
  • 乙组标准差 = 4.63(件)
  • 在甲乙两组工人平均日产量相等(都是16件)的情况下,甲组的标准差(7.40 件)大于乙组的标准差(4.63 件),因而其平均数的代表性比乙组小。

五、离散系数

  • 极差、平均差、标准差都是对数据的离中趋势进行绝对或平均差异的测定。
  • 在通常情况下,它们都带有计量单位,而月其离中趋势大小与变量平均水平的高低有关。
  • 因此,要比较数据平均水平不同的两组数据的离中程度的大小,就有必要计算它们的相对离中程度指标,即离散系数。
  • 常用的离散系数指标是标准差系数。

标准差系数是将一组数据的标准差与其算数平均数对比的结果,以测定其相对离中程度。

例:甲乙两班中,哪个班的平均成绩更具有代表性?

甲班的平均成绩为 70 分,标准差为 9.0 分,乙班的成绩分组如下:

成绩分组学生人数
60以下2
60 - 706
70 - 8025
80 - 9012
90 - 1005

以下分析乙班成绩:

按成绩分组

组中值(x)学生人数(f)xfx - 平均数(x - 平均数)的平方(x - 平均数)的平方 * 人数
60以下552110-22.4501.761003.52
60 - 70656390-12.4153.76922.56
70 - 8075251875-2.45.76144
80 - 90851210207.657.76693.12
90 - 10095547517.6309.761548.8
合计---503870------4312
  • 甲班的平均成绩为 70分,标准差为9.0分,标准差系数为 9.0 / 70 = 0.1286
  • 乙班的平均成绩为 3870 / 50 = 77.4 分
  • 乙班的标准差为 4312 / 50 的开根号 = 9.29 分

由于甲、乙两班成绩的平均值和标准差都不一样,无法使用标准差来比较哪个班的成绩波动大,因此必须使用离散系数来判断。从计算中可以看出:V乙<V甲,所以乙班的成绩波动小一些,则其班级的平均成绩更有代表性。

六、Python 计算 方差、标准差、离散系数

import dash
from dash import dcc, html
from dash.dependencies import Input, Output
import numpy as np# 创建 Dash 应用
app = dash.Dash(__name__)# 应用布局
app.layout = html.Div([html.H1('请输入数据'),dcc.Input(id='input-data', type='text', placeholder='输入数据,用逗号分隔'),html.Button('计算', id='compute-button', n_clicks=0),html.Div(id='output-container')
])# 回调函数,用于处理按钮点击事件
@app.callback(Output('output-container', 'children'),[Input('compute-button', 'n_clicks')],[dash.dependencies.State('input-data', 'value')]
)
def compute_var_std_mean(n_clicks, input_value):if n_clicks > 0:try:# 将输入字符串转换成数字列表data = list(map(float, input_value.split(',')))# 方差variance = np.var(data)# 标准差std_dev = np.std(data)# 均值mean = np.mean(data)# 离散系数coefficient_of_variation = std_dev / mean if mean != 0 else float('inf')# 显示结果output = [f'方差:{variance:.2f}'f'标准差:{std_dev:.2f}',f'离散系数:{coefficient_of_variation:.2f}']return '<br>'.join(output)except Exception as e:return str(e)if __name__ == '__main__':app.run_server(debug=True)

这篇关于【数据分析】数据的离中趋势之二 - 方差和标准差、离散系数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1090841

相关文章

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

使用SpringBoot整合Sharding Sphere实现数据脱敏的示例

《使用SpringBoot整合ShardingSphere实现数据脱敏的示例》ApacheShardingSphere数据脱敏模块,通过SQL拦截与改写实现敏感信息加密存储,解决手动处理繁琐及系统改... 目录痛点一:痛点二:脱敏配置Quick Start——Spring 显示配置:1.引入依赖2.创建脱敏

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

C#代码实现解析WTGPS和BD数据

《C#代码实现解析WTGPS和BD数据》在现代的导航与定位应用中,准确解析GPS和北斗(BD)等卫星定位数据至关重要,本文将使用C#语言实现解析WTGPS和BD数据,需要的可以了解下... 目录一、代码结构概览1. 核心解析方法2. 位置信息解析3. 经纬度转换方法4. 日期和时间戳解析5. 辅助方法二、L

使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)

《使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)》字体设计和矢量图形处理是编程中一个有趣且实用的领域,通过Python的matplotlib库,我们可以轻松将字体轮廓... 目录背景知识字体轮廓的表示实现步骤1. 安装依赖库2. 准备数据3. 解析路径指令4. 绘制图形关键

解决mysql插入数据锁等待超时报错:Lock wait timeout exceeded;try restarting transaction

《解决mysql插入数据锁等待超时报错:Lockwaittimeoutexceeded;tryrestartingtransaction》:本文主要介绍解决mysql插入数据锁等待超时报... 目录报错信息解决办法1、数据库中执行如下sql2、再到 INNODB_TRX 事务表中查看总结报错信息Lock

使用C#删除Excel表格中的重复行数据的代码详解

《使用C#删除Excel表格中的重复行数据的代码详解》重复行是指在Excel表格中完全相同的多行数据,删除这些重复行至关重要,因为它们不仅会干扰数据分析,还可能导致错误的决策和结论,所以本文给大家介绍... 目录简介使用工具C# 删除Excel工作表中的重复行语法工作原理实现代码C# 删除指定Excel单元

Linux lvm实例之如何创建一个专用于MySQL数据存储的LVM卷组

《Linuxlvm实例之如何创建一个专用于MySQL数据存储的LVM卷组》:本文主要介绍使用Linux创建一个专用于MySQL数据存储的LVM卷组的实例,具有很好的参考价值,希望对大家有所帮助,... 目录在Centos 7上创建卷China编程组并配置mysql数据目录1. 检查现有磁盘2. 创建物理卷3. 创