Oxford Nanopore Technologies实战应用之电信号比对工具Tombo

2023-10-25 05:41

本文主要是介绍Oxford Nanopore Technologies实战应用之电信号比对工具Tombo,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、前言

 二、Tombo快速使用

1.安装

2.快速使用

 3.比对结果解析

4.高阶应用

三、总结


一、前言

对于纳米孔测序常规用途,如基因组比对、SNV鉴别、宏基因组物种分析而言,用户一般使用碱基识别软件输出的fastq文件即可展开相应分析。但对于某些特殊用途,如甲基化鉴别、碱基识别算法开发,则需要深入分析纳米孔测序产生的fast5文件中原始电信号与碱基(A/T/G/C)之间的对应关系。那么,有没有软件可以实现这种功能呢?答案是ONT官方发布的软件Tombo。

 二、Tombo快速使用

1.安装

使用conda进行快速安装。

# install via bioconda environment (https://bioconda.github.io/#set-up-channels)
conda install -c bioconda ont-tombo

2.快速使用

假定fast5文件中已经有basecalls(即ATGC碱基),且Reference序列已知,那么最快速使用Tombo进行电信号比对的命令如下。输出的比对结果会写入到fast5文件中。

tombo resquiggle path/to/fast5s/ genome.fasta --processes 4 --num-most-common-errors 5

 3.比对结果解析

首先要读入fast5文件,可以使用h5py中的h5py.File函数读入,也可以使用其他第三方fast5分析软件。

import h5py
fast5_info = h5py.File(fast5_path, 'r')

然后,就可以在fast5_info['Analyses']['RawGenomeCorrected_000']['BaseCalled_template']['Events'][:]中找到碱基与电信号的对应关系。

并且,可以通过fast5_info['Analyses']['RawGenomeCorrected_000']['BaseCalled_template']['Alignment']的attrs来查看每条fast5与参考序列的比对信息,如比对起止位点、正负链信息等。

4.高阶应用

随着ONT测序技术的更新,并非所有fast5文件都可以直接被Tombo读入,此时需要考虑2个问题:

(1)fast5中是否有basecalls?某些用户在设置测序控制软件时,产生的fast5并不一定含有basecalls,此时就需要re-basecalling。

(2)fast5可能使用了VBZ压缩,此时就需要先安装hdf5插件(参考https://github.com/nanoporetech/vbz_compression/),然后才能继续使用h5py读取fast5。

三、总结

其实使用tombo resquiggle进行电信号比对还有许多细节需要注意,有兴趣的读者可以参考其说明书(https://nanoporetech.github.io/tombo/resquiggle.html)。比如,reads相对于reference序列出现了Indel(下图所示)要怎么获取电信号,Tombo也给出了解决方案。

这篇关于Oxford Nanopore Technologies实战应用之电信号比对工具Tombo的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/280389

相关文章

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

基于Python开发Windows自动更新控制工具

《基于Python开发Windows自动更新控制工具》在当今数字化时代,操作系统更新已成为计算机维护的重要组成部分,本文介绍一款基于Python和PyQt5的Windows自动更新控制工具,有需要的可... 目录设计原理与技术实现系统架构概述数学建模工具界面完整代码实现技术深度分析多层级控制理论服务层控制注

Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题

《Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题》在爬虫工程里,“HTTPS”是绕不开的话题,HTTPS为传输加密提供保护,同时也给爬虫带来证书校验、... 目录一、核心问题与优先级检查(先问三件事)二、基础示例:requests 与证书处理三、高并发选型:

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

Java 缓存框架 Caffeine 应用场景解析

《Java缓存框架Caffeine应用场景解析》文章介绍Caffeine作为高性能Java本地缓存框架,基于W-TinyLFU算法,支持异步加载、灵活过期策略、内存安全机制及统计监控,重点解析其... 目录一、Caffeine 简介1. 框架概述1.1 Caffeine的核心优势二、Caffeine 基础2

使用Node.js和PostgreSQL构建数据库应用

《使用Node.js和PostgreSQL构建数据库应用》PostgreSQL是一个功能强大的开源关系型数据库,而Node.js是构建高效网络应用的理想平台,结合这两个技术,我们可以创建出色的数据驱动... 目录初始化项目与安装依赖建立数据库连接执行CRUD操作查询数据插入数据更新数据删除数据完整示例与最佳

Oracle Scheduler任务故障诊断方法实战指南

《OracleScheduler任务故障诊断方法实战指南》Oracle数据库作为企业级应用中最常用的关系型数据库管理系统之一,偶尔会遇到各种故障和问题,:本文主要介绍OracleSchedul... 目录前言一、故障场景:当定时任务突然“消失”二、基础环境诊断:搭建“全局视角”1. 数据库实例与PDB状态2

Git进行版本控制的实战指南

《Git进行版本控制的实战指南》Git是一种分布式版本控制系统,广泛应用于软件开发中,它可以记录和管理项目的历史修改,并支持多人协作开发,通过Git,开发者可以轻松地跟踪代码变更、合并分支、回退版本等... 目录一、Git核心概念解析二、环境搭建与配置1. 安装Git(Windows示例)2. 基础配置(必

基于Go语言开发一个 IP 归属地查询接口工具

《基于Go语言开发一个IP归属地查询接口工具》在日常开发中,IP地址归属地查询是一个常见需求,本文将带大家使用Go语言快速开发一个IP归属地查询接口服务,有需要的小伙伴可以了解下... 目录功能目标技术栈项目结构核心代码(main.go)使用方法扩展功能总结在日常开发中,IP 地址归属地查询是一个常见需求: