excel统计分析——协方差分析的作用

2024-04-04 06:44

本文主要是介绍excel统计分析——协方差分析的作用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

参考资料:生物统计学

1、协变量与试验因素的区别

        如果把协方差分析资料中的协变量看作多因素方差分析资料中的一个因素,则两类资料有相似之处,但两类资料有本质的不同。在方差分析中,各因素的水平时人为控制的,即使是随机因素也是认为选定的;而在协方差分析中,协变量不能人为控制。

        例如,当考虑动物窝别对增重的影响时,一般可以把窝别当作随机因素,将不同窝看作不同水平,进行随机区组设计,同一窝的几只动物分别接受另一因素不同水平的处理,数据做方差分析。

        又如,如果考虑试验开始前动物初始体重的影响,以初始体重为一个因素,不同初始体重作为不同水平,进行随机区组设计,初始体重相同的动物为一组,分别接受另一因素不同水平的处理,数据方差分析也无问题。

        但是如果客供试验的动物很少,初始体重又有明显差异,无法选到足够相同或近似体重的动物,就只好对不同初始体重的动物进行不同饲料配方的处理,此时应当认为初始体重x与增重y有回归关系,采用协方差分析的方法排除初始体重的影响,然后再来比较其他因素对增重的影响。

        消除初始体重影响的另一种方法是对最终体重与初始体重的差值即y-x进行统计分析,但这种方法与协方差分析的生物学意义是不同的。对差值进行分析时假设初始体重对以后的体重增量没有任何影响,而协方差分析则是假设最终体重中包含初始体重的影响,这种影响的大小与初始体重成正比,即协方差分析是假设初始体重在以后的生长过程中也发挥作用,而对差值进行方差分析时假设初始体重以后不再发挥作用。

        协方差分析过程包含对协变量影响是否存在及其大小等一系列统计检验和估计,它显然比对差值进行分析等方法有更广泛的适用范围,因此除非有明显证据说明对差值进行分析的生物学假设是正确的,一般情况下应采用协方差分析的方法

        两种生物学假设显然不同,对于一种统计方法,不仅要注意它与其他方法在算法上的不同,更要注意算法背后的生物学假设有什么不同,这种深层次的理解有助于工作中选取正确的统计方法。

2、协方差分析的作用

        协方差分析有3个方面的作用:一是对试验进行统计控制;二是对协方差组分进行估计(分析不同变异源的相关关系);三是对缺失数据进行估计。

(1)对试验进行统计控制

        为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这称为试验控制(experimental control)。但在有些情况下,难以实现实验控制,需要辅助统计控制,经过统计学上的矫正,使试验误差减小,对试验处理效应的估计更为准确。

        如果y的变异主要由x的不同造成(处理没有显著效应),则矫正后的y'间将没有显著差异(但原y间的差异可能是显著的)。如果y的变异除去x不同的影响外,上存在不同处理的显著效应,则可期望各y'间将有显著差异(但原y间差异可能不显著)。此外,校正后的y'和原y的大小次序也常不一致。因此,处理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验处理的效应。

(2)估计协方差组分

        将相关系数公式r=\frac{\sum (x-\bar{x})(y-\bar{y})}{\sqrt{\sum(x-\bar{x})^2\sum(y-\bar{y})^2}}右边的分子、分母同除以自由度(n-1),得到

r=\frac{\frac{\sum (x-\bar{x})(y-\bar{y})}{n-1}}{\sqrt{\frac{\sum(x-\bar{x})^2}{n-1}\frac{\sum(y-\bar{y})^2}{n-1}}}

其中,\frac{\sum(x-\bar{x})^2}{n-1}\frac{\sum(y-\bar{y})^2}{n-1}分别为x、y的均方MSx、MSy。类似地,将\frac{\sum(x-\bar{x})(y-\bar{y})}{n-1}称为均积,记为MPxy,即

MP_{xy}=\frac{\sum(x-\bar{x})(y-\bar{y})}{n-1}=\frac{\sum xy-\frac{(\sum x)(\sum y)}{n}}{n-1}

于是,相关系数r可表示为:

r=\frac{MP_{xy}}{\sqrt{MS_x\cdot MS_y}}

        均方MSx、MSy对应的参数为总体方差\sigma_x^2\sigma_y^2,均积MP_xy对应的参数称为总体协方差(covariance),记为COV_{xy}\sigma_{xy}。统计学上可证明,均积MP_xy是协方差COV_{xy}的无偏估计量。均积和均方具有相似的形式,也有相似的性质。

        在方差分析中,一个变量的总平方和与自由度可按变异源进行剖析,从而求得相应的均方。统计学已证明:两个变量的总体乘积和预自由度也可按变异源进行分解而获得相应的均积。这种把两个变量的总乘积和与自由度按变异源进行剖析并获得相应均积的方法也称为协方差分析。

        在随机模型的方差分析中,根据均方MS和期望均方的关系,可以得到不同变异源的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积MP和期望均积的关系,可得到不同变异源的协方差组分的估计值。有了这些估计值,就可以进行相应的总体相关分析。

(3)对缺失数据进行估计

        利用方差分析对缺失数据进行估计,需以误差平方和最小为基础,会出现处理平方和向上偏倚的结果。如果利用协方差分析对缺失数据进行估计,既可保证误差平方和最小,又可避免处理平方和的偏倚。

这篇关于excel统计分析——协方差分析的作用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/875075

相关文章

Python实现Excel批量样式修改器(附完整代码)

《Python实现Excel批量样式修改器(附完整代码)》这篇文章主要为大家详细介绍了如何使用Python实现一个Excel批量样式修改器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录前言功能特性核心功能界面特性系统要求安装说明使用指南基本操作流程高级功能技术实现核心技术栈关键函

Python实现批量CSV转Excel的高性能处理方案

《Python实现批量CSV转Excel的高性能处理方案》在日常办公中,我们经常需要将CSV格式的数据转换为Excel文件,本文将介绍一个基于Python的高性能解决方案,感兴趣的小伙伴可以跟随小编一... 目录一、场景需求二、技术方案三、核心代码四、批量处理方案五、性能优化六、使用示例完整代码七、小结一、

C#使用Spire.XLS快速生成多表格Excel文件

《C#使用Spire.XLS快速生成多表格Excel文件》在日常开发中,我们经常需要将业务数据导出为结构清晰的Excel文件,本文将手把手教你使用Spire.XLS这个强大的.NET组件,只需几行C#... 目录一、Spire.XLS核心优势清单1.1 性能碾压:从3秒到0.5秒的质变1.2 批量操作的优雅

Android 缓存日志Logcat导出与分析最佳实践

《Android缓存日志Logcat导出与分析最佳实践》本文全面介绍AndroidLogcat缓存日志的导出与分析方法,涵盖按进程、缓冲区类型及日志级别过滤,自动化工具使用,常见问题解决方案和最佳实... 目录android 缓存日志(Logcat)导出与分析全攻略为什么要导出缓存日志?按需过滤导出1. 按

Linux中的HTTPS协议原理分析

《Linux中的HTTPS协议原理分析》文章解释了HTTPS的必要性:HTTP明文传输易被篡改和劫持,HTTPS通过非对称加密协商对称密钥、CA证书认证和混合加密机制,有效防范中间人攻击,保障通信安全... 目录一、什么是加密和解密?二、为什么需要加密?三、常见的加密方式3.1 对称加密3.2非对称加密四、

MySQL中读写分离方案对比分析与选型建议

《MySQL中读写分离方案对比分析与选型建议》MySQL读写分离是提升数据库可用性和性能的常见手段,本文将围绕现实生产环境中常见的几种读写分离模式进行系统对比,希望对大家有所帮助... 目录一、问题背景介绍二、多种解决方案对比2.1 原生mysql主从复制2.2 Proxy层中间件:ProxySQL2.3

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致