NGS基因测序(panel)报告解读数据库汇总

2024-01-09 20:20

本文主要是介绍NGS基因测序(panel)报告解读数据库汇总,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天我们来梳理一下肿瘤基因报告解读常见的数据库,大家有机会可以自己查询并且解读,涉及到的数据库有dbSNP数据库 、gnomAD数据库、ExAC数据库、1000 Genomes、HGMD 数据库、OMIM数据库、ClinVar数据库、InterVar数据库 、ClinGen数据库、GeneReviews数据库、HPO数据库、NCBI Gene数据库、UCSC Genome Browser、OncoKB、COSMIC、TCGA、HGVS、DECIPHER、esp6500、Cancer Gene Census数据库,Familial Cancer Database数据库、intOGen数据库,真的是非常多,我们一个一个来了解一下。

人群数据库

dbSNP数据库(https://www.ncbi.nlm.nih.gov/snp/)

dbSNP是由NCBI提供的,在这个数据库,可以查看是否有人已经发现了你的变体。dbSNP不仅包含SNPs(单核苷酸多态性),还有很多其他的变异,如短删除、插入和多核苷酸多态性。dbSNP中的数据有两种主要类型:由用户提交,可以通过“提交的SNP”(ss)标识符来识别;由多个提交的数据和来自其他来源的数据组合而成的数据,可以通过“reference SNP” (rs)标识符识别。
在这里插入图片描述
如上图所示,dbSNP提供了关于变异体的大量信息,将显示任何可用的rs。以BRCA2为例,dbSNP不仅给出了一些基本信息,例如命名法、有机体或分子类型,而且它还列出了PubMed中关于该变体的引用,并提供了指向所有引用文章的直接链接。在中间的列中,可以找到更多的分类信息,比如MAF/Minor Allele Count, MAF是一个等位基因在人群中发生的频率。在第三栏中,会发现人类基因组变异学会(HGVS)的名字,根据不同的术语来识别正在研究的基因。

gnomAD数据库(http://gnomad.broadinstitute.org)

基因组聚合数据库 (Genome Aggregation Database, gnomAD)是一个致力于从各种大规模测序项目中收集和协调外显子组和基因组测序数据,并为更广泛的科学界提供汇总数据的研究者联盟。

外显子组聚合联盟 (Exome Aggregation Consortium, ExAC)是gnomAD的前身(第一个发布版),包含了大量自有的人类外显子组数据。

gnomAD(v3.1.1)基于GRCh38,其中短变异(short variant)数据集涵盖了76,156个互不相关个体的基因组测序数据,是各种疾病特异性研究和群体遗传研究的一部分。

gnomAD(v2.1.1)基于GRCh37,其中短变异数据集涵盖了125,748个外显子和15,708个基因组,这些基因组来自作为各种疾病特异性研究和群体遗传研究的一部分的不相关的个体,总计141,456个。

gnomAD是目前最大的人群频率数据库。这些数据来源于各种疾病研究项目及大型人群测序项目。数据库包含基因的基本信息(基因名称、包含的变异位点个数、其他数据库的链接等);覆盖度信息(外显子测序的数据和全基因组测序的数据) 。

ExAC数据库(http://gnomad.broadinstitute.org)

ExAC数据库的全称是(the Exome Aggregation Consortium),外显子组整合数据库,是gnomAD数据库的第一个版本,只包含了外显子测序的数据,该数据库旨在汇总和协调各种大规模测序项目的外显子组测序数据,并为科学界提供更广泛的摘要数据,该数据库已被整合到gnomAD数据库。

1000 Genomes(https://www.internationalgenome.org/)

1000 Genome Project 的目标是发现在人群中频率大于1%的变异位点,对来自不同人群的大量样本进行测序,识别到了许多的变异位点,为人类遗传变异的研究提供了一个综合的资源。

疾病数据库

HGMD 数据库(http://www.hgmd.org)

HGMD 是人类遗传性疾病突变位点金标准数据库,通过遗传咨询专家阅读高质量的文献,收集和整理相关变异位点信息构建。该数据库提供变异位点对应的转录本、变异类型、致病性、相关表型、参考文献、人群频率、功能预测、结构域等信息。

HGMD专业版提供变异位点对应的HGVS编号、蛋白质的变化、等级分类、Hg19和Hg38基因组坐标、蛋白结构域、人群频率、软件预测结果等。
在这里插入图片描述

OMIM数据库(https://www.ncbi.nlm.nih.gov/omim/)

OMIM,即在线人类孟德尔遗传(Online Mendelian Inheritance in Man),是一个综合的、权威的研究人类表型和基因型关系的数据库,收录了所有已知的孟德尔疾病,和超过16000个基因的信息(涵盖一大半人类已知的基因)。

OMIM并不是创造了这些数据,而是对已发表的研究结果的非常系统的整理与整合,并每日更新、免费获取。OMIM中的一个常见的疾病的页面,其内容类似一篇综述,包含:表型与基因的关系、临床简介、疾病基本信息与描述、临床特征、诊断、临床管理、发病机制、分子遗传、群体遗传、动物模型、背景历史、研究进展和参考文献。

ClinVar数据库(https://www.ncbi.nlm.nih.gov/clinvar/)

clinvar数据库是一个人类遗传变异及其与疾病关联信息的公共数据库,收录了包括单核苷酸变异(SNP)、插入缺失(Indel)等在内的各种遗传变异,目前已经成为了人类遗传变异及其与疾病关联信息的最权威和最全面的公共数据库,是人类基因组信息的重要组成部分之一。

该数据库的主要特点如下:

1、数据来源:clinvar数据库主要来源于各种文献报道,包括科研论文、临床诊断报告、重要数据库汇总等。

2、数据形式:clinvar数据库为非关系型数据库,使用XML格式进行存储,数据分为变异基因型、疾病与遗传变异之间的关联、变异性质、变异对宿主基因的影响程度、证据等多个维度进行描述。

3、数据质量:clinvar数据库对各种遗传变异的收录要求较高,要求进行规范的表述、严格的证据支持、清晰的证据链路等,从而保证数据的准确性、权威性。

InterVar数据库(http://wintervar.WGlab.org/)

InterVar同样是位点致病性评判数据库,可以实现对ACMG 28条判读标准中的18条进行自动化评分,其余10条由于需要后续证据输入或者参数调整(例如Sanger测序验证结果或家系验证等)。

ClinGen数据库(https://www.clinicalgenome.org/)

ClinGen是美国国立卫生研究院(NIH)资助的数据库资源,用于精准医学,研究基因和变异的临床相关性。ClinGen提供了变异的剂量敏感性,有助于辨别突变的显隐性异常模式。更重要的是ClinGen结合临床、遗传模式、人群、功能证据及专家评审,根据ACMG/AMP指南对变异进行致病性分类,结果保存在ClinVar中。实验室和临床医生也可以使用ClinGen的”variant curation tools”来**评估尚未经过专家审查的变异致病性的证据。

综合性肿瘤数据库

OncoKB(https://www.oncokb.org/)

OncoKB数据库介绍及爬虫爬取位点用药信息

COSMIC(https://cancer.sanger.ac.uk/cosmic)

COSMIC是世界上最大最全面的有关肿瘤的体细胞突变以及其影响的资源库。

COSMIC是一个在人类癌症中发现的体细胞获得性突变的在线数据库。体细胞突变是在非生殖细胞中发生的,不是由儿童遗传的。 COSMIC是癌症中体细胞突变目录(Catalogue Of Somatic Mutations In Cancer)的首字母缩写,它从科学文献中的论文和桑格研究所癌症基因组计划的大规模实验筛选中提取数据。该数据库可供学术研究人员免费使用,并可向其他人商业许可。

COSMIC数据库旨在收集和显示有关癌症体细胞突变的信息。它于2004年推出,仅有四种基因HRAS,KRAS2,NRAS和BRAF的数据。已知这四种基因在癌症中是体细胞突变的。自创建以来,数据库迅速扩展。到2005年,COSMIC包含从115,327个肿瘤中筛选出的529个基因,描述了20,981个突变。到2009年8月,它包含了150万次实验的信息,包括近370,000个肿瘤中的13,423个基因,并描述了超过90,000个突变。2010年7月发布的COSMIC第48版,与国际癌症研究机构合作,整合了p53的突变数据。此外,它还为最新的人类参考基因组构建提供了更新的基因坐标。以后每 3 个月更新一次。

COSMIC数据库包含数千种与癌症发展有关的体细胞突变。该数据库从两个主要来源收集信息:

(1)从文献中收集已知癌症基因的突变。经历人工治疗的基因列表通过它们在癌症基因普查中的存在来确定。
(2)纳入数据库的数据来自癌症基因组计划进行的癌症样本的全基因组重测序研究。

这篇关于NGS基因测序(panel)报告解读数据库汇总的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/588317

相关文章

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

虚拟机Centos7安装MySQL数据库实践

《虚拟机Centos7安装MySQL数据库实践》用户分享在虚拟机安装MySQL的全过程及常见问题解决方案,包括处理GPG密钥、修改密码策略、配置远程访问权限及防火墙设置,最终通过关闭防火墙和停止Net... 目录安装mysql数据库下载wget命令下载MySQL安装包安装MySQL安装MySQL服务安装完成

MySQL进行数据库审计的详细步骤和示例代码

《MySQL进行数据库审计的详细步骤和示例代码》数据库审计通过触发器、内置功能及第三方工具记录和监控数据库活动,确保安全、完整与合规,Java代码实现自动化日志记录,整合分析系统提升监控效率,本文给大... 目录一、数据库审计的基本概念二、使用触发器进行数据库审计1. 创建审计表2. 创建触发器三、Java

SQL server数据库如何下载和安装

《SQLserver数据库如何下载和安装》本文指导如何下载安装SQLServer2022评估版及SSMS工具,涵盖安装配置、连接字符串设置、C#连接数据库方法和安全注意事项,如混合验证、参数化查... 目录第一步:打开官网下载对应文件第二步:程序安装配置第三部:安装工具SQL Server Manageme

C#连接SQL server数据库命令的基本步骤

《C#连接SQLserver数据库命令的基本步骤》文章讲解了连接SQLServer数据库的步骤,包括引入命名空间、构建连接字符串、使用SqlConnection和SqlCommand执行SQL操作,... 目录建议配合使用:如何下载和安装SQL server数据库-CSDN博客1. 引入必要的命名空间2.

Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式

《Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式》本文详细介绍如何使用Java通过JDBC连接MySQL数据库,包括下载驱动、配置Eclipse环境、检测数据库连接等关键步骤,... 目录一、下载驱动包二、放jar包三、检测数据库连接JavaJava 如何使用 JDBC 连接 mys

解读GC日志中的各项指标用法

《解读GC日志中的各项指标用法》:本文主要介绍GC日志中的各项指标用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、基础 GC 日志格式(以 G1 为例)1. Minor GC 日志2. Full GC 日志二、关键指标解析1. GC 类型与触发原因2. 堆

Java设计模式---迭代器模式(Iterator)解读

《Java设计模式---迭代器模式(Iterator)解读》:本文主要介绍Java设计模式---迭代器模式(Iterator),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录1、迭代器(Iterator)1.1、结构1.2、常用方法1.3、本质1、解耦集合与遍历逻辑2、统一

MySQL数据库中ENUM的用法是什么详解

《MySQL数据库中ENUM的用法是什么详解》ENUM是一个字符串对象,用于指定一组预定义的值,并可在创建表时使用,下面:本文主要介绍MySQL数据库中ENUM的用法是什么的相关资料,文中通过代码... 目录mysql 中 ENUM 的用法一、ENUM 的定义与语法二、ENUM 的特点三、ENUM 的用法1

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示