R语言进行孟德尔随机化+meta分析(2)----基于R和stata

2023-09-29 14:11

本文主要是介绍R语言进行孟德尔随机化+meta分析(2)----基于R和stata,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目前不少文章用到了孟德尔随机化+meta分析,在上一章咱们简单介绍了一下meta分析的基础知识。咱们今天来介绍一篇11分文章,由文章看看孟德尔随机化+meta分析如何进行,文章的题目是:Appraising the causal role of smoking in multiple diseases: A systematic review and meta-analysis of Mendelian randomization studies(评估吸烟在多种疾病中的因果作用:孟德尔随机研究的系统回顾和荟萃分析)
在这里插入图片描述
吸烟其实没什么创意,唯一的新意就是加入了孟德尔随机化和meta分析。我们可以看到文章的类型就是meta分析,说明孟德尔随机化+meta分析的本质就是个meta分析。作者先是介绍说吸烟与多种疾病之间的因果关系仍然不明确,目的是通过总结孟德尔随机化 (MR) 研究的证据来评估吸烟在多种疾病中的因果作用。
咱们看下它的方法学是怎么做的:
在这里插入图片描述

完全是meta分析的套路,分两步提取数据,
第一步:是搜索各大数据库“孟德尔随机化”与“吸烟”的相关文章,把文章中吸烟和疾病的关系的数据提取出来。纳入标准:原始全文文章,介绍了吸烟或终身吸烟的遗传易感性与一种或多种循环、消化、神经和肌肉骨骼系统疾病、内分泌、代谢和眼部疾病或肿瘤风险的关联结果。一共纳入了385篇文章。排除标准:基于相同或重叠研究样本的重复出版物,以及仅使用单一或少数(<10)尼古丁依赖或吸烟行为或数量的工具变量的研究。作者这里提取了年份,样本量,关系的比值比OR。经过排除后适合分析的有29篇。
第二步:有一部分数据就是芬兰基因研究(FinnGen)作者通过检索没有检索到资料,他就自己来做,他使用了 R6版本中的数据进行孟德尔随机化分析,其中包括 260 405 名芬兰人,但剔除了性别不明确、非芬兰血统、基因型缺失率超过 5%、或杂合度过高(±4 个标准差)的数据。此外,作者还利用 GWAS meta 分析中公开的汇总统计数据,对骨关节炎、痛风和原发性开角型青光眼进行了从头开始的 MR 分析。第二部分提取到的数据应该是27篇,因为最后供56篇文章。
下面是他的流程图:
流程图:
在这里插入图片描述
通过流程图咱们可以知道最后作者得到14篇循环疾病的文章,消化疾病8篇,神经系统疾病5篇,肌肉骨骼系统4篇,2篇内分泌,3篇眼科疾病,21篇关于肿瘤的文章。整个过程处理起来还是挺花时间的,毕竟要一篇篇的读,提取数据。
接下来咱们看看作者提供的数据,附表1是作者自己做的孟德尔随机化的结果,它的结果有两个,一个是刚开始吸烟,还有一个是终生吸烟。作者也是根据这两个结果进行meta分析的。
在这里插入图片描述

在这里插入图片描述
接下来就是作者的两个主表了,表2是开始吸烟的人的疾病分析,表3是终生吸烟的人的疾病分析,作者就是根据这两个表来做meta分析的,下面我把数据提取出来跑一下。
在这里插入图片描述
在这里插入图片描述
下面我把数据提取出来跑一下,数据量挺大的我就提取刚开始吸烟的患者循环疾病这部分举个例子,其他疾病的都是一样的。这里我们要注意一下,循环系统是有很多疾病的,就拿心房颤动这个疾病来说,作者的数据很多很大,他是把GWAS meta-analysis、FinnGen这2个数据库的结果进行相加,再来做meta分析,如果你的数据没有这么大,你把每个数据库先分别做,然后再汇总也是可以的。

bc<-read.csv("E:/r/test/smokemeta.csv",sep=',',header=TRUE)
names(bc)

数据提取出来后下图这个样子,这个数据可以按作者的方法进行提取,如果你想偷懒一点,使用我提取好的数据,公众号回复:代码,可以得到。
在这里插入图片描述
既往咱们已经介绍了《R语言forestploter包优雅的绘制孟德尔随机化研究森林图》,需要的可以自己看一下。今天咱们来介绍一下forestplot包绘制这个森林图,这个包相对简单一点,容易上手。

library(forestplot)

咱们先生成个可信区间

bc$`OR (95% CI)` <- sprintf("%.2f (%.2f to %.2f)", bc$OR, bc$LB, bc$UB)

在这里插入图片描述
生成可信区间后我们需要生成一个绘图区间,选择你需要的变量就可以了,我这里选1,2,6

dt1<-as.matrix(bc[,c(1,2,6)])

在这里插入图片描述
这里注意一下,dt这个数据是矩阵没有列名,我们还要生成一个列名

dt1 <- rbind(c("outcome","Cases","OR (95% CI)"),dt1)

在这里插入图片描述
这样的数据就可以绘图了

forestplot(labeltext=dt1,graph.pos="right", mean=c(NA,bc$OR),lower=c(NA,bc$LB),upper=c(NA,bc$UB),graphwidth = unit(60,"mm"),#设置图片位置和宽度boxsize =0.2,line.margin = unit(5,"mm"),#对散点和线条进行设置lineheight = unit(5,"mm"),#设置图形行距col=fpColors(box = "grey0",lines = "grey0",summary = "grey0"),colgap = unit(1,"mm"),#图形列间距zero = 1,#参照值xticks = c(0,1,2))#X轴的定义标签

在这里插入图片描述
咱们可以看到和作者做的几乎一模一样
在这里插入图片描述
为什么我说几乎一模一样,因为还是有点不一样的,作者没有11278肺栓塞这个数据,但是它的原数据是有的,估计绘图时忘记加进去了
在这里插入图片描述
绘图出来了,还有一个东西没有解决。有些论文是有报meta分析的I(异质性)和P值的,这个怎么求出来呢?
在这里插入图片描述
在这里插入图片描述
这个两个值作者文章推荐使用stata来计算,stata做meta分析简单了许多, 使用metan函数就行

metan or lb ub

在这里插入图片描述
在这里插入图片描述
图片还可以修改,我这里不弄了。最终算得I为80.6%,P为0.00,可能和作者有点不同,因为他少加了一个研究。最后作者还做了敏感性分析,是通过孟德尔随机化来做的,不是所有的文章都做,下面这篇文章就没做敏感性分析。
在这里插入图片描述
我这里就不弄了,有兴趣看我既往的文章。

这篇关于R语言进行孟德尔随机化+meta分析(2)----基于R和stata的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/22

相关文章

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

C语言进阶(预处理命令详解)

《C语言进阶(预处理命令详解)》文章讲解了宏定义规范、头文件包含方式及条件编译应用,强调带参宏需加括号避免计算错误,头文件应声明函数原型以便主函数调用,条件编译通过宏定义控制代码编译,适用于测试与模块... 目录1.宏定义1.1不带参宏1.2带参宏2.头文件的包含2.1头文件中的内容2.2工程结构3.条件编

Go语言并发之通知退出机制的实现

《Go语言并发之通知退出机制的实现》本文主要介绍了Go语言并发之通知退出机制的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1、通知退出机制1.1 进程/main函数退出1.2 通过channel退出1.3 通过cont

Go语言编译环境设置教程

《Go语言编译环境设置教程》Go语言支持高并发(goroutine)、自动垃圾回收,编译为跨平台二进制文件,云原生兼容且社区活跃,开发便捷,内置测试与vet工具辅助检测错误,依赖模块化管理,提升开发效... 目录Go语言优势下载 Go  配置编译环境配置 GOPROXYIDE 设置(VS Code)一些基本

Olingo分析和实践之EDM 辅助序列化器详解(最佳实践)

《Olingo分析和实践之EDM辅助序列化器详解(最佳实践)》EDM辅助序列化器是ApacheOlingoOData框架中无需完整EDM模型的智能序列化工具,通过运行时类型推断实现灵活数据转换,适用... 目录概念与定义什么是 EDM 辅助序列化器?核心概念设计目标核心特点1. EDM 信息可选2. 智能类

Olingo分析和实践之OData框架核心组件初始化(关键步骤)

《Olingo分析和实践之OData框架核心组件初始化(关键步骤)》ODataSpringBootService通过初始化OData实例和服务元数据,构建框架核心能力与数据模型结构,实现序列化、URI... 目录概述第一步:OData实例创建1.1 OData.newInstance() 详细分析1.1.1

Olingo分析和实践之ODataImpl详细分析(重要方法详解)

《Olingo分析和实践之ODataImpl详细分析(重要方法详解)》ODataImpl.java是ApacheOlingoOData框架的核心工厂类,负责创建序列化器、反序列化器和处理器等组件,... 目录概述主要职责类结构与继承关系核心功能分析1. 序列化器管理2. 反序列化器管理3. 处理器管理重要方

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监