学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?

本文主要是介绍学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 两独立样本秩和检验
    • 一、实战案例
    • 二、统计策略
    • 三、SPSS操作
      • 1、正态性检验
      • 2、两样本秩和检验
    • 四、结果解读
      • 疑问:曼-惠特尼 U数据分布图如何绘制?
    • 五、规范报告
      • 1、规范表格
      • 2、规范文字
    • 六、划重点

学习目的

SPSS第十二讲 | 两独立样本秩和检验如何做?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

两独立样本秩和检验

前面学习过两独立样本T检验,主要用于数据服从正态分布。
如果遇到数据严重偏态样本数据,可采用两种统计策略:一是将数据转化为正态分布数据;二是采用两独立样本秩和检验,一般用Mann-Whitney U 检验。
秩和检验的原理是将连续型数据排序后分配秩次,再对秩次做假设检验。假设检验的结果表述为“各组数据分布的差异有无统计学意义”。
需指出的是,虽然要重视数据的正态性,但样本量也很重要,如果样本量足够大(比如超过50),只要数据不是那么严重偏态,在近似正态范围内,也可使用t检验,而且更推荐用t检验。

一、实战案例

小白想了解男大侠和女大侠的收入差异。随机抽取了23名男侠和21名女侠,收集了每位大侠的性别和每月平均收入水平。
问,男女大侠之间的收入是否有差异?
读数据:

GETFILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十二讲:两独立样本秩和检验.sav'.

在这里插入图片描述

二、统计策略

统计分析策略口诀“目的引导设计,变量确定方法”。
针对上述案例,扪心六问。
Q1:本案例研究目的是什么?
A:比较差异。
比较男侠和女侠收入分布有无统计学差异
Q2:本案例属于什么研究设计?
A:属于随机观察性研究。
事实上,两样本秩和检验也可用于实验性研究。
Q3:有几个变量?
A:有两个变量。
①自变量为性别
②因变量为收入
Q4:变量类型是什么?
A:自变量为分类变量
因变量为连续型变量。
Q5:连续型变量服从正态分布么?
A:需要检验。
Q6:可采用何种统计方法?
A:若服从,采用两独立样本T检验;
若不服从正态,可采用两样本秩和检验。
概括而言,如果数据满足以下条件,则采用两独立样本秩和检验。在这里插入图片描述

三、SPSS操作

1、正态性检验

命令行:

EXAMINE VARIABLES=收入  BY  性别/PLOT HISTOGRAM NPPLOT /*若无此行,则不输出正态性检验表*//COMPARE GROUPS /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.

正态性检验结果:
在这里插入图片描述
直方图:
在这里插入图片描述
在这里插入图片描述
经S-W检验结果显示:男侠组收入P=0.332,女侠组收入P=0.002<0.01。同时结合直方图,可认为,男侠组服从正态分布,而女侠组不符合正态分布,建议采用两样本秩和检验。

2、两样本秩和检验

Step1 : 依次点击“分析—非参数检验–旧对话框–2个独立样本”,弹出两个独立样本检验对话框。
在这里插入图片描述
Step2 : 点击“收入”放入“检验变量”,性别放入“分组变量”同时进行定义组。
①检验类型:曼-惠特尼 U(Man-whttey U),是最常见的两样本秩和检验
②检验变量:即放入结局指标,本例为收入
③分组变量:放入性别。这里“定义组”需要进一步明确。
定义组:即指定比较哪两组。
在本例,我们比较男侠和女侠组,他们在数据库赋值为1和2,因此这里填写1,2;此处填什么数据,需要和数据库的赋值对应起来,且不能填写文字或者字母,只能填数字。
再次提醒:构建SPSS数据库时一般赋值建议用数字,不要用文字或者字母。
④选项:对总体数据进行基本的统计描述
在这里插入图片描述
继续,确定,输出结果。
命令行:

NPAR TESTS /M-W= 收入 BY 性别(1 2) /STATISTICS=DESCRIPTIVES QUARTILES /MISSING ANALYSIS.

四、结果解读

根据上述SPSS操作,秩和检验将提供3张表格。
表1:提供对收入的总体描述
在这里插入图片描述
表2:提供分组描述收入平均排名(秩平均值)和总排名(秩总和)在这里插入图片描述
统计描述为各组的“平均秩次”和“秩总和”,然而,“平均秩次”和“秩总和”并不能充分反映各组数据的集中趋势。一般论文不报告秩平均和秩总和。
那报告什么呢?
对于非正态分布数据,中位数是描述其集中趋势的较好指标,四分位数是描述离散趋势的较好指标。
对于正态分布数据,均数是描述其集中趋势的较好指标,标准差是描述离散趋势的较好指标。
表3:秩和检验分析结果在这里插入图片描述
曼-惠特尼U(Mann-Whitney U)和威尔克森W(Wilcoxon)是常用的两独立样本秩和检验方法。
两者的检验方法没有实质上的差别,检验原理和结果也完全等价,只是在计算统计量时略有差别,统计分析时写清楚用哪种方法即可。
我们主要关注Z值和对应的p值。本案例的Z=-0.787,p=0.431>0.05, 表明两者的数据分布无显著性差异(数据分布图如下所示):

疑问:曼-惠特尼 U数据分布图如何绘制?

请选择“分析”——“非参数检验”——“独立样本”方式,在“设置”中选择“曼-惠特尼U”检验,确定
在这里插入图片描述
在这里插入图片描述
即可输出该图:
在这里插入图片描述

命令行:

*Nonparametric Tests: Independent Samples. 
NPTESTS /INDEPENDENT TEST (收入) GROUP (性别) MANN_WHITNEY /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE/CRITERIA ALPHA=0.05  CILEVEL=95.

五、规范报告

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范表格

表 男女大侠收入差异比较在这里插入图片描述
注:数据不服从正态时,不能用平均数和标准差来描述;而应采用中位数和四分位距(第25百分位数和第75百分位数之距离)来描述。
如何获得中位数?详见第二讲|描述性统计,你学会了吗?

2、规范文字

经S-W检验以及直方图结果显示,女侠这一组数据不服从正态分布,故采用两样本Mann-Whitney U检验。
结果显示,男侠组收入的中位数11014.6(10168.9,11860)元,女侠组的中位数11739.5(10878.8,12600.3)元,两组总体收入分布不存在统计差异(Z=0.787,p =0.431)。

六、划重点

1、两独立样本的秩和检验主要是用于次序数据或不满足正态分布的连续型数据,一般用Mann-Whitney U检验。
2、如果数据严重偏态分布或存在若干个极端异常值,至少一组数据正态性检验p值接近0.01或者<0,01,优先考虑秩和检验。
3、秩和检验的描述性统计应采用中位数和四分位距(25%和75%位数),而非平均数和标准差。
小白学完两节秩和检验课程,心里又有几分成就感。
他想到了之前学习的配对样本T检验。如果数据不服从正态分布,那么也不适合T检验见,应该有配对秩和检验吧!
是的,小白思路没错,下一讲:配对样本秩和检验。

这篇关于学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/324832

相关文章

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核