零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(一)

2023-11-05 13:12

本文主要是介绍零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

经过一段时间的积累,搭建的分析平台已经日渐进入稳定的状态,很多粉丝也在和我们反馈,让我们出一下零代码生信套路课。

小编找了很久,发现某某机构出的TCGA联合GEO 免疫基因+代谢基因的生信套路,该套路应用常见相对来说比较广,又属于双热点套路。但是代码运行真的是太麻烦了,还有各种各样的报错,实在是不好弄,为此,我们推出了复现课程,该课程内容较长, 分成几篇进行讲解,如带来不便,请大家谅解!

一、TCGA数据的下载和预处理

这里通过生信豆芽菜官网可以直接下载TCGA的数据,比如这里我们以LUAD数据为例,

http://www.sxdyc.com/tcgaDataSet
在这里插入图片描述
下载后放在文件夹1.TCGA.pre下面
在这里插入图片描述
用excel打开TCGA.merge.cli.txthe tcga.merge.mRNA.TPM.txt的文件

1、整理表达谱数据
在这里插入图片描述
A列的数据为基因ENSG号,可以直接删掉,C列的数据需要注意,代表了基因的类型,比如说这里选择蛋白编码的基因,将其他类型的全部删掉
在这里插入图片描述
选择数据-筛选-将protein_coding的 基因保留下来,如果这里需要分析lncRNA,就单独只保留lncRNA
在这里插入图片描述
这时候,删掉A和C列的数据

将数据保存后,这里出来后的数据很容易出现重复的基因,所以可以使用我们的去重工具

http://www.sxdyc.com/singleCollectionTool?href-preprocess
在这里插入图片描述
选择去重工具,上传刚刚处理好的TCGA的表达谱数据,并选择去重的方法,等待运行结束即可。
在这里插入图片描述
当然如果文件过大,可以选择7-zip进行压缩,将文件压缩为.gz的格式

在这里插入图片描述
在这里插入图片描述
2、整理生存数据

打开文件后,先删掉后面无用的列名信息,去重
在这里插入图片描述
替换字符
在这里插入图片描述
去掉缺少生存时间和生存状态的样本
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
最后保存数据即可

二、GEO数据的下载和预处理

1、从NCBI的GEO dataset官网查找合适的GEO的数据集,可以通过关键词进行查找,也可以通过已经发表的文章进行筛选。

(https://www.ncbi.nlm.nih.gov/)
在这里插入图片描述
通过一些关键词进行搜索。

比如这里选择GSE31210,怎么下载呢
在这里插入图片描述
往下滑动,选择platforms(平台注释文件)和矩阵文件
在这里插入图片描述
在这里插入图片描述
2、表达谱数据和临床数据的处理

对GSE31210_series_matrix.txt.gz文件进行解压,然后excel打开
在这里插入图片描述
这一部分为样本的表型数据,有时候,表型的临床是存在原文的附件中。

表达谱的数据,这些信息都要删掉,同时拉到最后,将最后一行删掉。
在这里插入图片描述
然后保存一下数据
在这里插入图片描述
3、注释信息的准备

删掉多余的行和列,去掉一个探针对应多个基因名
在这里插入图片描述
选择筛选-包含-///,将这些行全部删掉。
在这里插入图片描述
在这里插入图片描述
合并数据
在这里插入图片描述
运行完成后
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在最后一列,有基因的名字,直接剪切粘贴到A列
在这里插入图片描述
这时候保存一下,再用去重工具,去一下重复的基因,在前面处理的时候,我们将一个探针对应多个基因的去掉了,那么这里的基因重复就是多个探针对应一个基因名,可以选择去重方法进行去重,这里就省略了
在这里插入图片描述
到这里数据的准备阶段基本就做完了,需要注意的是,在分析的过程中药注意基因的表达,相差大的,可以取一个log进行后续的分析。
#################################
到这里数据准备基本就结束,如果有兴趣可以关注公众号(豆芽数据分析)
有零代码复现相关问题,可以付费进入零代码答疑群和大家一起交流,群费为9.9元,拒绝白嫖党(添加微信:ShenxinBS003或者ShenxinBS001)

这篇关于零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/350091

相关文章

Spring Security介绍及配置实现代码

《SpringSecurity介绍及配置实现代码》SpringSecurity是一个功能强大的Java安全框架,它提供了全面的安全认证(Authentication)和授权(Authorizatio... 目录简介Spring Security配置配置实现代码简介Spring Security是一个功能强

通过cmd获取网卡速率的代码

《通过cmd获取网卡速率的代码》今天从群里看到通过bat获取网卡速率两段代码,感觉还不错,学习bat的朋友可以参考一下... 1、本机有线网卡支持的最高速度:%v%@echo off & setlocal enabledelayedexpansionecho 代码开始echo 65001编码获取: >

Java集成Onlyoffice的示例代码及场景分析

《Java集成Onlyoffice的示例代码及场景分析》:本文主要介绍Java集成Onlyoffice的示例代码及场景分析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 需求场景:实现文档的在线编辑,团队协作总结:两个接口 + 前端页面 + 配置项接口1:一个接口,将o

SpringBoot实现Kafka动态反序列化的完整代码

《SpringBoot实现Kafka动态反序列化的完整代码》在分布式系统中,Kafka作为高吞吐量的消息队列,常常需要处理来自不同主题(Topic)的异构数据,不同的业务场景可能要求对同一消费者组内的... 目录引言一、问题背景1.1 动态反序列化的需求1.2 常见问题二、动态反序列化的核心方案2.1 ht

IDEA实现回退提交的git代码(四种常见场景)

《IDEA实现回退提交的git代码(四种常见场景)》:本文主要介绍IDEA实现回退提交的git代码(四种常见场景),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.已提交commit,还未push到远端(Undo Commit)2.已提交commit并push到

Kotlin Compose Button 实现长按监听并实现动画效果(完整代码)

《KotlinComposeButton实现长按监听并实现动画效果(完整代码)》想要实现长按按钮开始录音,松开发送的功能,因此为了实现这些功能就需要自己写一个Button来解决问题,下面小编给大... 目录Button 实现原理1. Surface 的作用(关键)2. InteractionSource3.

使用Java实现Navicat密码的加密与解密的代码解析

《使用Java实现Navicat密码的加密与解密的代码解析》:本文主要介绍使用Java实现Navicat密码的加密与解密,通过本文,我们了解了如何利用Java语言实现对Navicat保存的数据库密... 目录一、背景介绍二、环境准备三、代码解析四、核心代码展示五、总结在日常开发过程中,我们有时需要处理各种软

Java List排序实例代码详解

《JavaList排序实例代码详解》:本文主要介绍JavaList排序的相关资料,Java排序方法包括自然排序、自定义排序、Lambda简化及多条件排序,实现灵活且代码简洁,文中通过代码介绍的... 目录一、自然排序二、自定义排序规则三、使用 Lambda 表达式简化 Comparator四、多条件排序五、

Java 压缩包解压实现代码

《Java压缩包解压实现代码》Java标准库(JavaSE)提供了对ZIP格式的原生支持,通过java.util.zip包中的类来实现压缩和解压功能,本文将重点介绍如何使用Java来解压ZIP或RA... 目录一、解压压缩包1.zip解压代码实现:2.rar解压代码实现:3.调用解压方法:二、注意事项三、总

Linux实现简易版Shell的代码详解

《Linux实现简易版Shell的代码详解》本篇文章,我们将一起踏上一段有趣的旅程,仿照CentOS–Bash的工作流程,实现一个功能虽然简单,但足以让你深刻理解Shell工作原理的迷你Sh... 目录一、程序流程分析二、代码实现1. 打印命令行提示符2. 获取用户输入的命令行3. 命令行解析4. 执行命令