从零开始学统计 07 | 标准误差

2024-06-02 22:58

本文主要是介绍从零开始学统计 07 | 标准误差,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、标准误差

假设测量一个基因的五个表达量:

mark

**标准偏差(Standard Deviation)**量化了一组测量值中的变化程度

同样的实验做五次,每次实验用不同的样本:

mark

把五个样本的平均值放在一个数轴:

mark

可以计算得到两个值:

mark

对五个样本的平均值取平均值,计算得到的标准偏差就是标准误差。

**标准误差(Standard Error)**量化了多组测量值均值的变化程度

不难发现:

  • 标准偏差量化了一组测量值中的变化程度
  • 标准误差量化了多组测量值均值的变化程度

二、标准误差的表示

三个样本

mark

绿色:均值

红色:标准偏差

如果不想展示原始数据,只需要反应标准偏差和均值就行,也就是下面的TNT图:

mark

误差棒(Error Bars)有三种类型:

  • 标准偏差(Standard Deviations)
  • 标准误差(Standard Errors)
  • 置信区间(Confidence Intervals)

经验法则:

均值 ± 一个标准偏差的数值范围,覆盖全部数值的68%

均值 ± 两个标准偏差的数值范围,覆盖全部数值的95%

计算平均值的标准误差

  • 抽取一组样本,每个样本都有相同数量的测量值
  • 计算每组样本的均值
  • 利用均值计算标准误差 Std.Err

mark

可以发现标准误差比标准偏差要小很多。这是因为平均值没有原始数据那么分散。

当然也可以计算标准偏差的标准偏差,这个值叫做标准偏差的标准误差。它告诉我们多个样本的标准偏差是如何分布的。

其实理论上,我们可以计算一切统计值的标准偏差,比如中位数,众数,百分数等的标准偏差,得到的值就是该统计值的标准误差。

标准误差只是来自同一群体的多个均值的标准偏差。

三、如何在一组样本中计算标准误差

自助抽样法(Bootstrap)

mark

  • 选取一个随机测量值
  • 记录该值
  • 重复以上两步,直到拿到 5 个测量值
  • 计算均值,中位数,众数等
  • 回到第一步,重复以上步骤,拿到多个统计量的值
  • 利用拿到的统计量的值,如均值计算标准偏差,得到标准误差

这篇关于从零开始学统计 07 | 标准误差的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1025327

相关文章

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

Pandas中统计汇总可视化函数plot()的使用

《Pandas中统计汇总可视化函数plot()的使用》Pandas提供了许多强大的数据处理和分析功能,其中plot()函数就是其可视化功能的一个重要组成部分,本文主要介绍了Pandas中统计汇总可视化... 目录一、plot()函数简介二、plot()函数的基本用法三、plot()函数的参数详解四、使用pl

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

Mysql如何将数据按照年月分组的统计

《Mysql如何将数据按照年月分组的统计》:本文主要介绍Mysql如何将数据按照年月分组的统计方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql将数据按照年月分组的统计要的效果方案总结Mysql将数据按照年月分组的统计要的效果方案① 使用 DA

一文详解SQL Server如何跟踪自动统计信息更新

《一文详解SQLServer如何跟踪自动统计信息更新》SQLServer数据库中,我们都清楚统计信息对于优化器来说非常重要,所以本文就来和大家简单聊一聊SQLServer如何跟踪自动统计信息更新吧... SQL Server数据库中,我们都清楚统计信息对于优化器来说非常重要。一般情况下,我们会开启"自动更新

opencv实现像素统计的示例代码

《opencv实现像素统计的示例代码》本文介绍了OpenCV中统计图像像素信息的常用方法和函数,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 统计像素值的基本信息2. 统计像素值的直方图3. 统计像素值的总和4. 统计非零像素的数量

如何使用 Bash 脚本中的time命令来统计命令执行时间(中英双语)

《如何使用Bash脚本中的time命令来统计命令执行时间(中英双语)》本文介绍了如何在Bash脚本中使用`time`命令来测量命令执行时间,包括`real`、`user`和`sys`三个时间指标,... 使用 Bash 脚本中的 time 命令来统计命令执行时间在日常的开发和运维过程中,性能监控和优化是不

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

flume系列之:查看flume系统日志、查看统计flume日志类型、查看flume日志

遍历指定目录下多个文件查找指定内容 服务器系统日志会记录flume相关日志 cat /var/log/messages |grep -i oom 查找系统日志中关于flume的指定日志 import osdef search_string_in_files(directory, search_string):count = 0

hdu4267区间统计

题意:给一些数,有两种操作,一种是在[a,b] 区间内,对(i - a)% k == 0 的加value,另一种操作是询问某个位置的值。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import