统计教程|PASS实现单因素二元Logistic回归分析且自变量为二分类的优势比检验的样本量估计

本文主要是介绍统计教程|PASS实现单因素二元Logistic回归分析且自变量为二分类的优势比检验的样本量估计,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在对临床数据的探索分析工作中,我们经常会使用Logistic回归分析去探索影响疾病的发生、发展的重要影响因素,或应用Logistic回归模型进行相关的预测分析。但是在进行Logistic回归分析时,样本含量的估计常常是令临床科研工作者最头痛的一件事了。常常纠结选哪些作为自变量或选多少个合适,因为大家通常采取的办法是选取研究中拟纳入的协变量个数的10~15倍(也有教科书上指出:经验上病例和对照的人数应该至少各有30~50例)作为样本含量的估计值。但大家应该注意,这个条件仅满足了多因素Logistic回归分析时数学运算所需的最低要求,这并不能保证足够的检验效能;此外,当研究设计阶段对协变量信息认识不全面时,也给样本含量的估计带来了困难。

由于Logistic回归主要描述了因变量和自变量间的一种非线性的关系,在进行Logistic回归分析的样本量估算时应根据其各自不同的适用条件选取不同的估算公式。不同的软件采用的样本量计算公式有所差异PASS软件作为功能强大的样本量计算软件,针对多种Logistic回归分析的都有针对的模块可进行计算,今天我们主要讲解PASS15.0软件实现当自变量为二分类的单因素二元Logistic回归分析时其优势比Wald检验的样本量估计。在PASS15.0软件中使用的是Demidenko等人2007年提出的近似公式,当只有一个自变量(假设该自变量为X)且为二分类变量时(X=0表示未发生,X=1表示发生),其主要的计算公式如下:

其中`P=(1-R)P0+ R(P1),即研究对象中Y=1的比例。

公式中,N为所需的样本含量,P0为X=0时Y=1的发生率,P1为X=1时Y=1的发生率(有时我们只知道OR,此时我们可根据:

得到:

但是在PASS15软件中可选择直接采用OR值进行计算),R为研究对象中X=1的比例,Z1-α/2表示标准正态分布的第1-α/2分位数或双侧α界值、Z1-β表示标准正态分布的第1-β分位数或单侧β界值,Z1-α/2和Z1-β均可通过查阅Z值表获得。

下面我们在本节将主要讲解采用PASS15.0软件实现当只有一个二分类变量时单因素二元Logistic回归分析时其优势比Wald检验所需样本含量估计方法。

例:假设某妇产科医生想研究同型半胱氨酸(HCY)与早产的关系,有报道表明,当孕妇血浆中HCY<12.4μmol/L时发生率为0.06,HCY≥12.4μmol/L时发生率为0.18,假定孕妇中HCY≥12.4μmol/L的人群占比为7%,α=0.05(双侧检验),β=0.20,问需要调查多少研究对象?

解析:本例严格来说应属于调查研究,其主要结局指标是是否发生早产,为二分类变量,主要研究因素(X)为孕妇的HCY是否≥12.4μmol/L,主要目的是研究HCY的水平与早产发生的关系,故我们可采用单因素Logistic回归分析两者的因果关系,可采用协变量为二分类变量的单因素二元Logistic回归分析的计算公式进行样本含量估算。本例共确定了五个参数:①α=0.05(双侧检验);②检验效能(1-β)=0.8;③X=0时Y=1的发生率(P0)=0.06,④X=1时Y=1的发生率(P1)=0.18;⑤研究对象中X=1的比例 R=7%。

PASS软件样本含量估算的具体步骤:

01 PASS主菜单进入样本含量估算设置界面:

打开PASS15软件,①点击Regression菜单并双击或其前面的“+”展开子菜单栏;→②点击Logistic Regression菜单并双击或其前面的“+”展开子菜单栏;→③点击Binary X(Wald Test);→④点击Tests for the Odds Ratio in Logistic Regression with One Binary X(Wald Test)→弹出Tests for the Odds Ratio in Logistic Regression with One Binary X(Wald Test)对话框进入单因素二元Logistic回归分析的样本含量估计界面,详见操作示意图(图1)。

02 PASS样本含量估算参数设置:

①Solve For:Sample Size,首先说明我们本次所求的结果为样本含量;→②Alternative Hypothesis:Two-Sided,表明进行双侧检验;→③Power:0.8,表明检验效能(1-β)为80%;→④Alpha:0.05,表示检验水准为0.05;→⑤P0[Pr(Y=1|X=0)]:0.06 ,指定X=0时Y=1的发生概率,即本例当HCY<12.4μmol/L时发生早产的概率为0.06;→⑥Use P1 or ORyx:P1,指定采用指标P1还是ORyx估算样本量(P1和ORyx可根据相关公式相互转换),由于本例知道了P1的取值,故本例选择采用P1估算样本量;→⑦P1[Pr(Y=1|X=1)]:0.18,指定X=1时Y=1的发生概率,即本例当HCY≥12.4μmol/L时发生早产的概率为0.18;→⑧Percent with X=1:7,指定研究对象中X=1的比例,即本例中孕妇人群中HCY≥12.4μmol/L的患者比例大约占总人群的7%;→⑨击Calculate按钮,完成单因素二元Logistic回归分析的样本含量估算,详见操作示意图(图2)。

03 PASS样本含量估算结果:

由图3可知,PASS软件给出的自变量为二分类的单因素二元Logistic回归分析样本含量估算结果主要有:样本含量估算的结果、相关参考文献、样本量估算报告中出现各名词的定义、对计算结果的总结描述以及假定脱落率为20%时所需的样本含量估计结果和其各名词的相关定义。由于脱落率不同研究结果各不相同,故本次不看脱落率为20%的相关结果,我们主要关注N这一结果即可:本研究最少需要596例孕妇作为研究对象才可能得出HCY含量高低与早产的发生有显著相关的结论。

想要了解更多统计教程相关知识,可到常笑医学网医学统计栏目进行查询和学习。

这篇关于统计教程|PASS实现单因素二元Logistic回归分析且自变量为二分类的优势比检验的样本量估计的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/162205

相关文章

2025版mysql8.0.41 winx64 手动安装详细教程

《2025版mysql8.0.41winx64手动安装详细教程》本文指导Windows系统下MySQL安装配置,包含解压、设置环境变量、my.ini配置、初始化密码获取、服务安装与手动启动等步骤,... 目录一、下载安装包二、配置环境变量三、安装配置四、启动 mysql 服务,修改密码一、下载安装包安装地

电脑提示d3dx11_43.dll缺失怎么办? DLL文件丢失的多种修复教程

《电脑提示d3dx11_43.dll缺失怎么办?DLL文件丢失的多种修复教程》在使用电脑玩游戏或运行某些图形处理软件时,有时会遇到系统提示“d3dx11_43.dll缺失”的错误,下面我们就来分享超... 在计算机使用过程中,我们可能会遇到一些错误提示,其中之一就是缺失某个dll文件。其中,d3dx11_4

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库

Linux下在线安装启动VNC教程

《Linux下在线安装启动VNC教程》本文指导在CentOS7上在线安装VNC,包含安装、配置密码、启动/停止、清理重启步骤及注意事项,强调需安装VNC桌面以避免黑屏,并解决端口冲突和目录权限问题... 目录描述安装VNC安装 VNC 桌面可能遇到的问题总结描js述linux中的VNC就类似于Window

linux下shell脚本启动jar包实现过程

《linux下shell脚本启动jar包实现过程》确保APP_NAME和LOG_FILE位于目录内,首次启动前需手动创建log文件夹,否则报错,此为个人经验,供参考,欢迎支持脚本之家... 目录linux下shell脚本启动jar包样例1样例2总结linux下shell脚本启动jar包样例1#!/bin

go动态限制并发数量的实现示例

《go动态限制并发数量的实现示例》本文主要介绍了Go并发控制方法,通过带缓冲通道和第三方库实现并发数量限制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录带有缓冲大小的通道使用第三方库其他控制并发的方法因为go从语言层面支持并发,所以面试百分百会问到

Go语言并发之通知退出机制的实现

《Go语言并发之通知退出机制的实现》本文主要介绍了Go语言并发之通知退出机制的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1、通知退出机制1.1 进程/main函数退出1.2 通过channel退出1.3 通过cont

Python实现PDF按页分割的技术指南

《Python实现PDF按页分割的技术指南》PDF文件处理是日常工作中的常见需求,特别是当我们需要将大型PDF文档拆分为多个部分时,下面我们就来看看如何使用Python创建一个灵活的PDF分割工具吧... 目录需求分析技术方案工具选择安装依赖完整代码实现使用说明基本用法示例命令输出示例技术亮点实际应用场景扩

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

如何在Java Spring实现异步执行(详细篇)

《如何在JavaSpring实现异步执行(详细篇)》Spring框架通过@Async、Executor等实现异步执行,提升系统性能与响应速度,支持自定义线程池管理并发,本文给大家介绍如何在Sprin... 目录前言1. 使用 @Async 实现异步执行1.1 启用异步执行支持1.2 创建异步方法1.3 调用