qiita上传和分析16S rRNA数据

2023-12-28 04:20
文章标签 分析 数据 上传 16s rrna qiita

本文主要是介绍qiita上传和分析16S rRNA数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

qiita(https://qiita.ucsd.edu/)是一个用于微生物组学研究的在线工具和资源库平台。

上传数据

  1. 注册并登陆

  1. 准备样品序列文件及meta信息和preparation文件

样品序列文件:后缀可以为fastq,fastq.gz,fasta,fna,不可以为fq等

meta文件:后缀可以为txt和tsv,第一列列名必须为sample_name,后面各列为样品meta信息,列名中不能出现空格(可以使用下划线_代替),样品名中不能出现“-”,列与列之间以table键分隔。

sample_name

Gender

Age

Caries

S1

Male

Prime

No

S2

Male

Youth

Yes

S3

Female

Prime

No

preparation文件格式:后缀可以为txt和tsv,第一列列名必须为sample_name,后面各列为样品测序信息,run_prefix为序列文件的前缀,如S1样品对应的序列文件为S1.R1.fastq,S1.R2.fastq;platform为测序平台信息,target_gene为测序基因(如16S rRNA,WMS等);target_subfragment为测序区域;列与列之间以table键分隔。

sample_name

run_prefix

platform

target_gene

target_subfragment

S1

S1

Illumina

16S rRNA

V3-V4

S2

S2

Illumina

16S rRNA

V3-V4

S3

S3

Illumina

16S rRNA

V3-V4

  1. 创建项目并填写必要的相关信息

已经创建的项目可以通过点击Study-》View Studies查看

  1. 选择Upload Files,单击select from your computer上传序列文件,样品meta信息文件及preparation文件(如果要通过服务器上传文件,则需要服务器可以通过外网登陆访问,所以一般我们是用本地上传比较多)

  1. 点击<< Go to study description,返回研究介绍页面,单击左侧的Sample Information,点击Choose file选择上传的meta信息文件,data type选择16S,点击Create完成样品信息上传

  1. 在新的页面中Updata sample information的Choose file内选择上传的preparation文件,单击右侧的Update完成样品上传

数据基础分析

点击左侧的样品信息,会出现样品分析网络界面,点击Add Default Workflow,再点击Run,可以执行默认的分析操作,包括Split Libraries FASTQ,data trimming,Deblur和Pick closed-reference OTUs操作,最终得到biom格式的feature table

数据进一步分析

  1. 点击生成的biom文件(三角符号),点击下方的Add to Analysis按钮,添加数据(可以添加多组数据到同一个analysis中)。Deblur结果通常选择deblur reference hit table添加到analysis中。

  1. 添加完成后页面右上角从右数第二个图标会变成绿色,点击这个图标

  1. 在这里可以删除选择的样品,最后点击Create Analysis,填写相关信息后点击Create analysis按钮可以生成一个Private的数据分析项目

这两个三角一个包括进化树,一个不包括,如果要做涉及到进化树的alpha/beta diversity,应该选择包含进化树的那一个三角形。

已经创建的分析项目,可以通过点击主页的Analysis-》See Previous Analyses查看

  1. 点击图中代表biom文件的三角形,点击下方的Process按钮可以选择要进行的分析操作

这篇关于qiita上传和分析16S rRNA数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/545054

相关文章

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

pandas数据的合并concat()和merge()方式

《pandas数据的合并concat()和merge()方式》Pandas中concat沿轴合并数据框(行或列),merge基于键连接(内/外/左/右),concat用于纵向或横向拼接,merge用于... 目录concat() 轴向连接合并(1) join='outer',axis=0(2)join='o

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499