学习笔记|线性相关分析|绘制散点图|计算r系数|双变量线性相关性分析|规范表达|《小白爱上SPSS》课程:SPSS第十八讲:如何进行线性相关分析?

本文主要是介绍学习笔记|线性相关分析|绘制散点图|计算r系数|双变量线性相关性分析|规范表达|《小白爱上SPSS》课程:SPSS第十八讲:如何进行线性相关分析?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 线性相关分析
    • 0 引言
    • 1. 绘制散点图
    • 2.计算r系数
    • 一、实战案例
    • 二、统计策略
    • 统计分析步骤:
    • 三、SPSS操作
      • 1、正态性检验
      • 2、绘制散点图
      • 3、正式分析
    • 四、结果解读
    • 五、规范表达
      • 1、规范图表
      • 2、规范文字
    • 六、划重点

学习目的

SPSS第十八讲:如何进行线性相关分析?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

线性相关分析

0 引言

在统计学中,事物或现象之间的关系是通过变量间的关系反映出来的。变量间的关系分为确定性关系和非确定性关系两类。确定性关系即函数关系。然而在实际问题中,随机变量之间虽有某种关系,但这种关系却难以用精确的表示方法来描述(不像数学函数),那么这种非确定性关系即相关关系。
在科研中,经常需要分析两种现象或事物之间的关系,例如,百米跑成绩与跳远成绩间有无关系?如果有,其关系如何?百米跑成绩提高0.01s,跳远成绩将会受到何种影响?对于这类变量间关系的研究就属于相关与回归问题。
我们今天要学习的线性相关分析就是对两个变量之间有无和关系大小做出统计推断的方法。
分析两个变量之间有无关系我们常用两种方法:

1. 绘制散点图

考察相关性最简单而直观的方法就是在XOY直角坐标系上画出散点图,通过散点图可以看出两个变量间是否存在线性关系。通过散点图,我们可以绘制如下四种相关图形。
在这里插入图片描述
但是散点图只能大致描述两个变量之间是否存在关系,而不能够准确度量两个变量关系密切程度,因此我们我们会用数学上的方法去计算准确的相关关系。

2.计算r系数

对于两个连续型变量来说,描述两个变量之间直线关系的密切程度和相关方向的统计指标叫做相关系数,统计上也称为Pearson积矩相关系数。
样本线性相关系数一般用r表示、总体相关系数一般用p表示。相关系数没有单位,其取值范围为|r|≤1。
计算公式如下(不明白公式,可以感受一下,然后略过):
在这里插入图片描述
① 符号:如果为正号,则表示正相关,如果为负号,则表示负相关。
② 取值为0,这是极端,表示不相关。取值为1,表示完全正相关,取值为-1,表示完全负相关
③ 若变量间的直线关系越密切,则|r|越接近于1;当变量之间的直线关系越不密切,|r|越接近0
④ 根据样本资料计算出的相关系数r是一个样本计算量,存在抽样误差。因此必须对r进行显著性检验,以判断其是否来自总体相关系数p=0的一个样本。
所以相关系数r是表示两个随机变量之间呈直线相关的强度和方向的统计量。

一、实战案例

小白测得12名女大侠的体重和肺活量数据,如下表。问:体重和肺活量之间有无关系?
读数据:

GET FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十八讲:线性相关分析.sav'. 

在这里插入图片描述

二、统计策略

统计分析策略口诀“目的引导设计,变量确定方法”。
针对上述案例,扪心七问。
Q1:本案例研究目的是什么?
A:关联分析。
Q2:分析的组数是多少呢?
A:两组数据。
Q3:本案例属于什么研究设计?
A:调查研究
Q4:有几个变量?
A:有两个变量。体重与肺活量。
Q5:变量类型是什么?
A:体重和肺活量都属于连续型变量。
Q6:组内两变量数据服从正态分布么?
A:需要检验。若服从,可以进一步检验双变量关系是否为线性关系;若不服从正态,采用秩相关分析。
Q7:组内双变量关系是否为线性关系?
A:需要检验。
概括而言,如果数据满足以下条件,则采用线性相关分析。
在这里插入图片描述

统计分析步骤:

第一,考察直线的可能性
第二,计算r值
第三,用样本推算总体,运用t检验。
第四,直线性关系的有无及大小

三、SPSS操作

1、正态性检验

本案例需要对体重和肺活量都进行正态性检验。
在这里插入图片描述
经S-W(夏皮洛-威尔克)检验,体重、肺活量数据的p值分别为0.490和0.465,均大于0.05,无统计学意义,支持原假设,可认为两组数据符合正态分布。

2、绘制散点图

操作方式:依次点击“图形——旧对话框——散点图/点图——简单散点图”。
在这里插入图片描述
命令行:

GRAPH /SCATTERPLOT(BIVAR)=体重 WITH 肺活量 /MISSING=LISTWISE.

在这里插入图片描述
初步分析:两变量间存在线性相关趋势,没有发现明显的异常值。

3、正式分析

Step1:操作方式:“分析——相关——双变量”
Step2:将【体重】【肺活量】放入【变量】窗口,同时选择【皮尔逊】相关系数。
在这里插入图片描述
命令行:

CORRELATIONS /VARIABLES=体重 肺活量 /PRINT=TWOTAIL NOSIG  /*显著性检验:双尾*//MISSING=PAIRWISE	 /*皮尔逊*/.

四、结果解读

在这里插入图片描述
可以看到,Pearson相关分析结果显示,r=0.828, p=0.01, 具有统计学意义,不接受原假设:数据无相关性有误,表示体重和肺活量存在正相关。

五、规范表达

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范图表

(1)如果只有两个变量之间相关,建议采用散点图呈现结果更直观。
在这里插入图片描述
(2)如果是多个变量之间关系,则可采用类似相关矩阵来描述。
在这里插入图片描述

2、规范文字

Person相关分析结果显示,体重与肺活量的相关系数r=0.828,p=0.001,表明体重与肺活量之间存在正相关。
小白学习完了线性相关分析课程,向主任汇报了自己分析成果。
主任看后说:“小白,如果不服从正态分布,你可知怎么办吗?”
小白说:“…”
主任说:“那你还是好好学习,天天向上吧!”
小白查查了下一讲内容:秩相关分析。

六、划重点

1、随机变量之间难以用精确的表示方法来描述(不像数学函数)的非确定性关系即相关关系。
2、线性相关分析就是对两个变量之间有无和关系大小做出统计推断的方法。
3、分析两个变量之间有无关系我们常用两种方法:绘制散点图和计算r系数。
4、线性相关分析要求两个连续型变量均服从正态性分布,若不服从正态分布,则采用秩相关。
5、相关系数r是表示两个随机变量之间呈直线相关的强度和方向的统计量。
6、计算完r后要检验r是否具有统计学意义。

这篇关于学习笔记|线性相关分析|绘制散点图|计算r系数|双变量线性相关性分析|规范表达|《小白爱上SPSS》课程:SPSS第十八讲:如何进行线性相关分析?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/340205

相关文章

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

Olingo分析和实践之EDM 辅助序列化器详解(最佳实践)

《Olingo分析和实践之EDM辅助序列化器详解(最佳实践)》EDM辅助序列化器是ApacheOlingoOData框架中无需完整EDM模型的智能序列化工具,通过运行时类型推断实现灵活数据转换,适用... 目录概念与定义什么是 EDM 辅助序列化器?核心概念设计目标核心特点1. EDM 信息可选2. 智能类

Olingo分析和实践之OData框架核心组件初始化(关键步骤)

《Olingo分析和实践之OData框架核心组件初始化(关键步骤)》ODataSpringBootService通过初始化OData实例和服务元数据,构建框架核心能力与数据模型结构,实现序列化、URI... 目录概述第一步:OData实例创建1.1 OData.newInstance() 详细分析1.1.1

Olingo分析和实践之ODataImpl详细分析(重要方法详解)

《Olingo分析和实践之ODataImpl详细分析(重要方法详解)》ODataImpl.java是ApacheOlingoOData框架的核心工厂类,负责创建序列化器、反序列化器和处理器等组件,... 目录概述主要职责类结构与继承关系核心功能分析1. 序列化器管理2. 反序列化器管理3. 处理器管理重要方

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监

如何使用Lombok进行spring 注入

《如何使用Lombok进行spring注入》本文介绍如何用Lombok简化Spring注入,推荐优先使用setter注入,通过注解自动生成getter/setter及构造器,减少冗余代码,提升开发效... Lombok为了开发环境简化代码,好处不用多说。spring 注入方式为2种,构造器注入和setter

MySQL进行数据库审计的详细步骤和示例代码

《MySQL进行数据库审计的详细步骤和示例代码》数据库审计通过触发器、内置功能及第三方工具记录和监控数据库活动,确保安全、完整与合规,Java代码实现自动化日志记录,整合分析系统提升监控效率,本文给大... 目录一、数据库审计的基本概念二、使用触发器进行数据库审计1. 创建审计表2. 创建触发器三、Java

SpringBoot中六种批量更新Mysql的方式效率对比分析

《SpringBoot中六种批量更新Mysql的方式效率对比分析》文章比较了MySQL大数据量批量更新的多种方法,指出REPLACEINTO和ONDUPLICATEKEY效率最高但存在数据风险,MyB... 目录效率比较测试结构数据库初始化测试数据批量修改方案第一种 for第二种 case when第三种