统计杂碎记录

2023-12-14 21:08
文章标签 统计 记录 杂碎

本文主要是介绍统计杂碎记录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

统计杂碎记录

PS: 记录一些自己平时遇到的数理统计概念,持续更新中,后续补充学习

1. nested random intercept effects
建议参考:Visualizing Nested and Cross Random Effects

2. 方差膨胀因子Variance Inflation Factor (VIF)
这个概念呢其实在做PCA, RDA或者其它类似的分析时可能会用到。
首先要知道多重共线性:当解释变量之间存在一定程度的相关性(近似共线性)时,也可以称之为多重共线性。
这会造成什么后果呢?当有多重共线性的情况发生时,参数估计的结果不再具有有效性,因此,在进行逻辑回归之前,我们需要通过VIF检验排除掉某些有多重共线性的变量。通常,当VIF>10时,就认为存在多重共线性,该特征需要删除。

VIF指的是解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比,可以反映多重共线性导致的方差的增加程度。
V I F = 1 1 − R 2 VIF =\frac{1}{1-R^{2}} VIF=1R21

这里的R2,即线性回归中的决定系数,可以由因变量和自变量之间的复相关系数的平方得到。
为了得到每一个变量的 VIF,我们需要以每一个变量为因变量对其余所有变量进行线性回归,对每一个变量得到各自的R2,再计算每一个变量的 VIF。

具体计算例子可参考
数理统计基础——多重共线性、方差膨胀因子和决定系数

3. 置换多元变量分析/置换多元方差分析(Permutational multivariate analysis of variance,PERMANOVA)
当因变量不止一个时,即一个或多个因子变量对应了多个因变量时,可使用多元方差分析(MANOVA)。
但是其条件非常苛刻,要求数据满足多元正态性、方差-协方差矩阵同质性,大部分案例中都是直接拒绝的。

这里补充一下协方差矩阵:
【多维随机变量的协方差矩阵】对多维随机变量X=[X1, X2, X3, … , Xn]T 我们需要计算各维度两两之间的协方差,这样各协方差就组成了一个 n x n 的矩阵,成为协方差矩阵。协方差矩阵是个对称矩阵,对角线上的元素是各维度上随机变量的方差(其实就是方差-协方差矩阵)。定义协方差矩阵为∑,矩阵内的元素 ∑ij 为:
∑ i j = c o v ( X i , X j ) = E [ ( X i − E ( X i ) ) ( X j − E ( X j ) ) ] \displaystyle\sum_{ij} =cov(X_i, X_j)=E[(X_i-E(X_i))(X_j-E(X_j))] ij=cov(Xi,Xj)=E[(XiE(Xi))(XjE(Xj))]

替代方法可选择稳健MANOVA,或者而非参数的方法,常用置换多元方差分析(PERMANOVA),又称非参数多因素方差分析(nonparametric multivariate analysis of variance),或Adoins分析,其本质是基于F统计的方差分析,依据距离矩阵对总方差进行分解的非参数多元方差分析方法。可利用半度量(如Bray-Curtis)或度量距离矩阵(如Euclidean)对总方差进行分析,通过线性模型分析不同组因素或环境因子(如临床表型数据、土壤理化指标等)对样品差异的解释度,并用置换检验进行显著性分析
使用PERMANOVA可分析不同分组因素对样品差异的解释度,并使用置换检验进行显著性统计

这里再补充一下, MRPP多响应置换过程分析(Multiple Response Permutation Procedure)。用来检验组间(两组或多组)的差异是否显著大于组内差异。与ANOSIM分析类似,可利用半度量或度量距离矩阵计算A值表示组间差异,使用置换检验对分组进行显著性分析。
还有一个,ANOSIM相似性分析。是一种非参数检验,用于检验高纬度数据间的相似性,比较组间和组内差异的大小,从而判断分组是否有意义。可以用于检验两组的组间和组内差异,也可以用于多组。
原理如下,以最基本的两个组为例:
现一共有6个样本,根据我们的实验方案将其氛围两组,Group1和Group2,每组含有3个样本。
1 首先基于组内样本间的距离计算组内的相似性
在这里插入图片描述
2 基于组间的距离计算组间的相似性
在这里插入图片描述
结合组内和组间,得到:
在这里插入图片描述
然后根据公式计算R值:
在这里插入图片描述
rb 和 rw分别为组间和组内差异性秩的平均值;n 即样本数量
因此,R 取值范围为 [-1, 1]:
当R趋向于1时,说明组间差异大于组内差异;
当 R=0 时,说明组间没有差异,即分组无效,不同分组之间没有差异;
当 R 趋向于 -1 时,说明组间差异小于组内差异。
当 R>0 时,还要进一步检验这种差异是否具有可信度,ANOSIM中对其的检验方法也是使用置换检验。

在这里插入图片描述
以上关于ANOSIM相似性分析的图片是参考了哪个网站上的讲解,并非本人原创,但是不记得是在哪里看到做的笔记了……以后找到会补充上。

这篇关于统计杂碎记录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/493879

相关文章

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

IDEA与MyEclipse代码量统计方式

《IDEA与MyEclipse代码量统计方式》文章介绍在项目中不安装第三方工具统计代码行数的方法,分别说明MyEclipse通过正则搜索(排除空行和注释)及IDEA使用Statistic插件或调整搜索... 目录项目场景MyEclipse代码量统计IDEA代码量统计总结项目场景在项目中,有时候我们需要统计

基于Spring Boot 的小区人脸识别与出入记录管理系统功能

《基于SpringBoot的小区人脸识别与出入记录管理系统功能》文章介绍基于SpringBoot框架与百度AI人脸识别API的小区出入管理系统,实现自动识别、记录及查询功能,涵盖技术选型、数据模型... 目录系统功能概述技术栈选择核心依赖配置数据模型设计出入记录实体类出入记录查询表单出入记录 VO 类(用于

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

Zabbix在MySQL性能监控方面的运用及最佳实践记录

《Zabbix在MySQL性能监控方面的运用及最佳实践记录》Zabbix通过自定义脚本和内置模板监控MySQL核心指标(连接、查询、资源、复制),支持自动发现多实例及告警通知,结合可视化仪表盘,可有效... 目录一、核心监控指标及配置1. 关键监控指标示例2. 配置方法二、自动发现与多实例管理1. 实践步骤

在Spring Boot中集成RabbitMQ的实战记录

《在SpringBoot中集成RabbitMQ的实战记录》本文介绍SpringBoot集成RabbitMQ的步骤,涵盖配置连接、消息发送与接收,并对比两种定义Exchange与队列的方式:手动声明(... 目录前言准备工作1. 安装 RabbitMQ2. 消息发送者(Producer)配置1. 创建 Spr

在Linux终端中统计非二进制文件行数的实现方法

《在Linux终端中统计非二进制文件行数的实现方法》在Linux系统中,有时需要统计非二进制文件(如CSV、TXT文件)的行数,而不希望手动打开文件进行查看,例如,在处理大型日志文件、数据文件时,了解... 目录在linux终端中统计非二进制文件的行数技术背景实现步骤1. 使用wc命令2. 使用grep命令

k8s上运行的mysql、mariadb数据库的备份记录(支持x86和arm两种架构)

《k8s上运行的mysql、mariadb数据库的备份记录(支持x86和arm两种架构)》本文记录在K8s上运行的MySQL/MariaDB备份方案,通过工具容器执行mysqldump,结合定时任务实... 目录前言一、获取需要备份的数据库的信息二、备份步骤1.准备工作(X86)1.准备工作(arm)2.手

SpringBoot3应用中集成和使用Spring Retry的实践记录

《SpringBoot3应用中集成和使用SpringRetry的实践记录》SpringRetry为SpringBoot3提供重试机制,支持注解和编程式两种方式,可配置重试策略与监听器,适用于临时性故... 目录1. 简介2. 环境准备3. 使用方式3.1 注解方式 基础使用自定义重试策略失败恢复机制注意事项