NBT:快准全!geNomad——宏病毒组鉴定新工具

2023-10-20 13:21

本文主要是介绍NBT:快准全!geNomad——宏病毒组鉴定新工具,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

期刊:nature biotechnology

影响因子:46.9

发表时间:2023年9月

在测序数据中识别可移动遗传元件对了解其多样性、生态学、生物技术应用和对公共健康的影响至关重要。本研究开发了geNomad——可同时识别和注释测序数据中的质粒和病毒序列。geNomad使用227897个标记蛋白图谱的数据集来提供病毒基因组的功能基因注释和分类匹配。geNomad还使用条件随机场模型高精度检测整合到宿主基因组中的前病毒。在线使用网址:https://portal.nersc.gov/genomad.

图1 geNomad网页主页面

1、鉴定和注释质粒和病毒的框架

geNomad采用混合方法进行质粒和病毒鉴定,结合了无比对分类器(序列分支)和基于基因的分类器(标记分支),通过利用两种分类器的优势来提高分类性能。

图片

图2 鉴定和注释质粒和病毒的框架

2、生成蛋白质图谱数据集,用于序列分类和蛋白质注释

geNomad使用染色体、质粒或病毒特异性的227,897个蛋白质谱的标记物集对基因进行分类,并为处理的序列提供功能信息。

图片

图3  蛋白质图谱数据集

3、geNomad可准确识别质粒和病毒

与其他工具相比,geNomad在质粒和病毒分类任务中,在所有序列长度范围内均表现出较好的总体分类性能,短序列中尤其明显。

图片

图4  基因组准确地识别病毒和质粒

4、敏感、精确的鉴定前噬菌体

其他流行工具(Phigaro39、VIBRANT和VirSorter2)进行了比较,geNomad性能更优,划分的前噬菌体更完整,污染水平较低。

图片

图5  使用标记信息来划分原噬菌体的边界

5、geNomad运行速度快,可对大型数据集进行分析

其他流行工具相比,geNomad运行速度快,并且geNomad的标记和序列分支可以独立运行,可以将运行时间减少一半。geNomad最近被用于处理超过2.7万亿个碱基对的测序数据,从而发现了数百万种包含在IMG/VR和IMG/PR数据库中的病毒和质粒。 

表1  质粒和病毒鉴定工具的分类方法和平均运行时间

图片

6、geNomad可以发现RNA病毒和巨型病毒

开发者使用病毒的最新知识训练geNomad,大大提高了geNomad对RNA病毒和巨型病毒的鉴定能力。

图片

图6  环境测序数据中发现RNA病毒和巨型病毒

结论

geNomad结合基因信息和深度神经网络信息来识别质粒和病毒序列,使用了超过200,000个标记蛋白谱的数据集对病毒基因组的功能基因进行注释和分类分配。使用条件随模型,高精度地检测整合到宿主基因组中的前噬菌体。在基准测试中,各种性能大大优于其他工具。


凌恩生物宏病毒分析流程已更新使用geNomad,用于宏病毒数据中前噬菌体的鉴定。更多测序项目了解,请关注凌恩生物公众号,紧跟CNS步伐,用最新的流程助力您的科研! 


参考文献

Identification of mobile genetic elements with geNomad.nature biotechnology,2023.

这篇关于NBT:快准全!geNomad——宏病毒组鉴定新工具的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/247383

相关文章

基于Python实现进阶版PDF合并/拆分工具

《基于Python实现进阶版PDF合并/拆分工具》在数字化时代,PDF文件已成为日常工作和学习中不可或缺的一部分,本文将详细介绍一款简单易用的PDF工具,帮助用户轻松完成PDF文件的合并与拆分操作... 目录工具概述环境准备界面说明合并PDF文件拆分PDF文件高级技巧常见问题完整源代码总结在数字化时代,PD

Python按照24个实用大方向精选的上千种工具库汇总整理

《Python按照24个实用大方向精选的上千种工具库汇总整理》本文整理了Python生态中近千个库,涵盖数据处理、图像处理、网络开发、Web框架、人工智能、科学计算、GUI工具、测试框架、环境管理等多... 目录1、数据处理文本处理特殊文本处理html/XML 解析文件处理配置文件处理文档相关日志管理日期和

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

基于Python实现简易视频剪辑工具

《基于Python实现简易视频剪辑工具》这篇文章主要为大家详细介绍了如何用Python打造一个功能完备的简易视频剪辑工具,包括视频文件导入与格式转换,基础剪辑操作,音频处理等功能,感兴趣的小伙伴可以了... 目录一、技术选型与环境搭建二、核心功能模块实现1. 视频基础操作2. 音频处理3. 特效与转场三、高

基于Python开发一个图像水印批量添加工具

《基于Python开发一个图像水印批量添加工具》在当今数字化内容爆炸式增长的时代,图像版权保护已成为创作者和企业的核心需求,本方案将详细介绍一个基于PythonPIL库的工业级图像水印解决方案,有需要... 目录一、系统架构设计1.1 整体处理流程1.2 类结构设计(扩展版本)二、核心算法深入解析2.1 自

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.