HLAreporter : HLA分型软件简介

2023-10-12 02:50

本文主要是介绍HLAreporter : HLA分型软件简介,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注"生信修炼手册"

在前面的文章中,我们详细介绍了HLA Allel的命名格式,示意图如下

从示意图可以看出,一个HLA Allel 可以分成四个字段,在加上最后的修饰后缀,共5个字段;在定义HLA 分型结果的分辨率时,会根据分型结果的最大位数来判断,如果只给出了字段一,即血清学分类的信息,代表是2位的分型结果;如果最多给出了字段二,即对应的蛋白信息,代表是4位的分型结果;如果最多给出了字段三,即CDS区信息,代表是8位的分型结果;如果分型结果给出了最后的后缀,代表是9位的分型结果。

HLA分型的技术手段很多,比如芯片,高通量测序等;不同手段识别到的HLA Allel 分辨率不同,如果只能给出2位的分型结果,则属于低分辨率;如果给出4位分型结果,属于中分辨率;能够给出8位或以上分型结果,属于高分辨率。

本篇文章主要介绍HLA  reporter 软件,该软件可以利用高通量测序的结果进行HLA 分型。其分型结果分辨率高,最多可到9位。下图是该软件与其他同类软件的比较结果

可以看到,在测试样本中,HLAreporter 软件分型结果由于HLAminer 的结果。该截图来自于官方文献,链接如下

https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-015-0145-3

软件的官网如下

http://paed.hku.hk/genome/software.html

安装过程如下

wget http://paed.hku.hk/genome/software/HLAreporter.zip
unzip HLAreporter.zip
cd HLAreporter.v103

HLAreporter.sh就是该软件的运行脚本。其原理如下

由于HLA的多态性,直接比对reads到参考基因组是不行的 ,HLAreporter 设计了一个CRP(comprehensive reference panel)参考基因组 , CRP 构建时参考了IMGT/HLA 数据库中已知的HLA  Allel信息,通过bwa将reads与CRP比对,提取比对到某个HLA基因的reads,然后进行组装,将组装的contig与数据库比较,确定最终的Allel。

该软件的用法如下

bash HLAreporter.sh test HLA_B test.R1.fq test.R2.fq

第一个参数test代表样本名称;第二个参数代表检测的HLA基因,第三个和第四个参数代表双端测序的fastq序列。

整个pipeline 分成了3个部分

1. bwa 比对 CRP 数据库

当你提供了原始的fastq 数据时,会自动调用4digit_map_HLA.sh脚本进行比对
该脚本核心内容如下

bwa aln exon23_high_resolution_multi_ref.fa $1 > $3_1_exon23_high_resolution_multi_ref.sai
bwa aln exon23_high_resolution_multi_ref.fa $2 > $3_2_exon23_high_resolution_multi_ref.sai
bwa sampe exon23_high_resolution_multi_ref.fa $3_1_exon23_high_resolution_multi_ref.sai $3_2_exon23_high_resolution_multi_ref.sai $1 $2 > $3_exon23_high_resolution_multi_ref.sam
samtools view -bS $3_exon23_high_resolution_multi_ref.sam > $3_exon23_high_resolution_multi_ref.bam
samtools view -b -F 4 $3_exon23_high_resolution_multi_ref.bam > $3_exon23_high_resolution_multi_ref_mappedreads.bam
samtools sort $3_exon23_high_resolution_multi_ref_mappedreads.bam $3_exon23_high_resolution_multi_ref_mappedreads_sorted
samtools index $3_exon23_high_resolution_multi_ref_mappedreads_sorted.bam

$1$2分别对应双端测序的R1和R2端reads, $3表示样本名称,通过调用bwa sampe,将原始的双端reads与exon23_high_resolution_multi_ref.fa比对,生成exon23_high_resolution_multi_ref_mappedreads_sorted.bam 文件。

2. 识别HLA Allel

对于HLA-A , HLA-B, HLA-C 这三个I型基因而言,调用4digit_predict_classI_ssake.sh脚本;对于HLA II 型基因,调用4digit_predict_classII_main.sh脚本。

3. 给出Allel 在不同人群中的频率

利用ANFD数据库中的信息,给出每个Allel在不同人群中的频率,通过脚本HLAfreq.sh实现。

最终输出结果保存在results目录下,示意如下

------------------------------------------------------------------
HLAreporter version 1.03
Report created
Fri Apr 17 11:24:24 HKT 2015
------------------------------------------------------------------
AlleleDRB1*01:01:01G
AlleleDRB1*04:07:01G
PhaseDRB1*04:08:01
Alleles detected
DRB1*01:01:01G
DRB1*01:17
DRB1*04:08:01
DRB1*04:07:01G
Gap location:
97    208
Non-polymorphic gap:
111 bp
HLA data quality profile:
10xcov%    100    20xcov%    100    30xcov%    97    50xcov%    89
------------------------------------------------------------------
HLA allele frequency
Four populations in Europe China Japan Africa are shown
By allele frequency net database (www.allelefrequencies.net)
------------------------------------------------------------------
[Allele]    [EUR]    [CHN]    [JPN]    [AFR]
DRB1*01:01    0.0860    0.0230    0.0582    0.0130
DRB1*04:07    0.0112    0.0030    0.0057    0.0030
DRB1*04:08    0.0039    0.0020    0.0000    0.0000
DRB1*01:17    0.0000    0.0000    0.0000    0.0000

HLAreporter目前只支持对以下11个基因的分型

  1. HLA_A

  2. HLA_B

  3. HLA_C

  4. HLA_DRB1

  5. HLA_DRB2

  6. HLA_DRB3

  7. HLA_DRB4

  8. HLA_DRB5

  9. HLA_DQB1

  10. HLA_DPB1

  11. HLA_DQA1

扫描关注微信号,更多精彩内容等着你!

这篇关于HLAreporter : HLA分型软件简介的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/192708

相关文章

Spring Security简介、使用与最佳实践

《SpringSecurity简介、使用与最佳实践》SpringSecurity是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架,本文给大家介绍SpringSec... 目录一、如何理解 Spring Security?—— 核心思想二、如何在 Java 项目中使用?——

Java Stream 并行流简介、使用与注意事项小结

《JavaStream并行流简介、使用与注意事项小结》Java8并行流基于StreamAPI,利用多核CPU提升计算密集型任务效率,但需注意线程安全、顺序不确定及线程池管理,可通过自定义线程池与C... 目录1. 并行流简介​特点:​2. 并行流的简单使用​示例:并行流的基本使用​3. 配合自定义线程池​示

PostgreSQL简介及实战应用

《PostgreSQL简介及实战应用》PostgreSQL是一种功能强大的开源关系型数据库管理系统,以其稳定性、高性能、扩展性和复杂查询能力在众多项目中得到广泛应用,本文将从基础概念讲起,逐步深入到高... 目录前言1. PostgreSQL基础1.1 PostgreSQL简介1.2 基础语法1.3 数据库

Python库 Django 的简介、安装、用法入门教程

《Python库Django的简介、安装、用法入门教程》Django是Python最流行的Web框架之一,它帮助开发者快速、高效地构建功能强大的Web应用程序,接下来我们将从简介、安装到用法详解,... 目录一、Django 简介 二、Django 的安装教程 1. 创建虚拟环境2. 安装Django三、创

MySQL 索引简介及常见的索引类型有哪些

《MySQL索引简介及常见的索引类型有哪些》MySQL索引是加速数据检索的特殊结构,用于存储列值与位置信息,常见的索引类型包括:主键索引、唯一索引、普通索引、复合索引、全文索引和空间索引等,本文介绍... 目录什么是 mysql 的索引?常见的索引类型有哪些?总结性回答详细解释1. MySQL 索引的概念2

Qt QCustomPlot库简介(最新推荐)

《QtQCustomPlot库简介(最新推荐)》QCustomPlot是一款基于Qt的高性能C++绘图库,专为二维数据可视化设计,它具有轻量级、实时处理百万级数据和多图层支持等特点,适用于科学计算、... 目录核心特性概览核心组件解析1.绘图核心 (QCustomPlot类)2.数据容器 (QCPDataC

Qt 设置软件版本信息的实现

《Qt设置软件版本信息的实现》本文介绍了Qt项目中设置版本信息的三种常用方法,包括.pro文件和version.rc配置、CMakeLists.txt与version.h.in结合,具有一定的参考... 目录在运行程序期间设置版本信息可以参考VS在 QT 中设置软件版本信息的几种方法方法一:通过 .pro

安装centos8设置基础软件仓库时出错的解决方案

《安装centos8设置基础软件仓库时出错的解决方案》:本文主要介绍安装centos8设置基础软件仓库时出错的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录安装Centos8设置基础软件仓库时出错版本 8版本 8.2.200android4版本 javas

如何确定哪些软件是Mac系统自带的? Mac系统内置应用查看技巧

《如何确定哪些软件是Mac系统自带的?Mac系统内置应用查看技巧》如何确定哪些软件是Mac系统自带的?mac系统中有很多自带的应用,想要看看哪些是系统自带,该怎么查看呢?下面我们就来看看Mac系统内... 在MAC电脑上,可以使用以下方法来确定哪些软件是系统自带的:1.应用程序文件夹打开应用程序文件夹

rust 中的 EBNF简介举例

《rust中的EBNF简介举例》:本文主要介绍rust中的EBNF简介举例,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1. 什么是 EBNF?2. 核心概念3. EBNF 语法符号详解4. 如何阅读 EBNF 规则5. 示例示例 1:简单的电子邮件地址