代码:DESeq2包做转录组RNAseq差异分析

2023-10-09 09:20

本文主要是介绍代码:DESeq2包做转录组RNAseq差异分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

教程来自:R语言DESeq2包做转录组RNAseq差异表达分析的一个简单小例子_哔哩哔哩_bilibili

代码:

getwd()
counts<-read.csv("lsm/counts.csv",row.names = 1)head(counts)
dim(mycounts)
counts_1<-counts[rowSums(counts) != 0,]
dim(counts_1)
group<-read.csv("lsm/group.csv",stringsAsFactors = T)
group
colnames(counts_1) == group$id'''
如果没有安装DESeq2,使用如下命令进行安装,
把两个井号去掉
'''
#install.packages("BiocManager")
#BiocManager::install("DESeq2")
library(DESeq2)dds <- DESeqDataSetFromMatrix(countData=counts_1, colData=group, design=~dex)dds <- DESeq(dds)
res <- results(dds)head(res)
class(res)
res_1<-data.frame(res)
class(res_1)
head(res_1)
dim(res_1)
library(dplyr)
res_1 %>% mutate(group = case_when(log2FoldChange >= 1 & pvalue <= 0.05 ~ "UP",log2FoldChange <= -1 & pvalue <= 0.05 ~ "DOWN",TRUE ~ "NOT_CHANGE")) -> res_2table(res_2$group)write.csv(res_2,file="rnaseq/diff_expr_result.csv",quote = F)

制作count.csv时应注意:

1.第一列选取gene_id,不然会有重复项。

2.数据选择read counts,注意不是FPKM。

3.counts列表里的read counts需要为整数。因此在excel种用ROUND函数四舍五入取整。

4.第一列不能有表头

ROUND函数四舍五入取整数
做好的样子

报错有重复项:提示  1.有重复值 2.表头没删除

制作group.vsc

列的顺序要和counts里行的顺序一致

踩坑:

1.报错:Error: unexpected ')' in " )"

跟括号没关系,其实是代码忘加逗号。   

修改前

修改后:

res_1 %>%mutate(group = case_when(log2FoldChange >= 2 & padj <= 0.05 ~ "up",log2FoldChange <= 2 & padj <= 0.05 ~ "down",TRUE ~ "not_change")) -> res_2

遇到跑不通的多跑几次

这篇关于代码:DESeq2包做转录组RNAseq差异分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/171866

相关文章

Django开发时如何避免频繁发送短信验证码(python图文代码)

《Django开发时如何避免频繁发送短信验证码(python图文代码)》Django开发时,为防止频繁发送验证码,后端需用Redis限制请求频率,结合管道技术提升效率,通过生产者消费者模式解耦业务逻辑... 目录避免频繁发送 验证码1. www.chinasem.cn避免频繁发送 验证码逻辑分析2. 避免频繁

精选20个好玩又实用的的Python实战项目(有图文代码)

《精选20个好玩又实用的的Python实战项目(有图文代码)》文章介绍了20个实用Python项目,涵盖游戏开发、工具应用、图像处理、机器学习等,使用Tkinter、PIL、OpenCV、Kivy等库... 目录① 猜字游戏② 闹钟③ 骰子模拟器④ 二维码⑤ 语言检测⑥ 加密和解密⑦ URL缩短⑧ 音乐播放

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

Olingo分析和实践之EDM 辅助序列化器详解(最佳实践)

《Olingo分析和实践之EDM辅助序列化器详解(最佳实践)》EDM辅助序列化器是ApacheOlingoOData框架中无需完整EDM模型的智能序列化工具,通过运行时类型推断实现灵活数据转换,适用... 目录概念与定义什么是 EDM 辅助序列化器?核心概念设计目标核心特点1. EDM 信息可选2. 智能类

Olingo分析和实践之OData框架核心组件初始化(关键步骤)

《Olingo分析和实践之OData框架核心组件初始化(关键步骤)》ODataSpringBootService通过初始化OData实例和服务元数据,构建框架核心能力与数据模型结构,实现序列化、URI... 目录概述第一步:OData实例创建1.1 OData.newInstance() 详细分析1.1.1

Olingo分析和实践之ODataImpl详细分析(重要方法详解)

《Olingo分析和实践之ODataImpl详细分析(重要方法详解)》ODataImpl.java是ApacheOlingoOData框架的核心工厂类,负责创建序列化器、反序列化器和处理器等组件,... 目录概述主要职责类结构与继承关系核心功能分析1. 序列化器管理2. 反序列化器管理3. 处理器管理重要方