使用Minimac进行基因型填充

2023-10-17 04:10

本文主要是介绍使用Minimac进行基因型填充,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注”生信修炼手册”!

Minimac是一款经典的基因型填充软件,该软件也是以内存消耗小,运行速度快而著称,历经了MaCH, minimac, minimac2, minmac3多个版本的更新换代,目前最新版本为v4, 网址如下

https://genome.sph.umich.edu/wiki/Minimac4

源代码保存在github上,网址如下

https://github.com/statgen/Minimac4

为了减少内存消耗,和beagle软件类似,minimac提出了一种名为M3VCF的格式,用来存储referenc panel的单倍型信息,将单倍型划分为不同的block, 示意如下

上图表示的是9个SNP位点构成的8种单倍型,minimac会根据染色体位置划分成不同的block区间,识别block区间内的unique haplotypes。两个邻近的block区域必须有一个重叠的位点,图中的9个位点划分成了两个block, 1-6号位点对应block B, 6到9号位点对应block B+1。在block B中,有3种唯一的单倍型,对应三种不同颜色。

M3VCF的内容示意如下

和VCF格式类似,在每个blcok的开头会有一行用于显示block的信息,包含的变异位点数VARIANTS,unique haplotype的个数REPS等,详细的介绍请参考以下链接

https://genome.sph.umich.edu/wiki/M3VCF_Files

相比VCF格式,该格式磁盘占用小,读取速度更快,内存消耗小。官网提供了1000G的reference panel供下载,链接如下

https://genome.sph.umich.edu/wiki/Minimac4#Reference_Panels_for_Download

该软件推荐的基因型填充pipeline步骤如下

  1. study样本分型结果的质量控制,参考GWAS的质控条件

  2. 对质控后的分型结果进行pre-phasing, 支持MACH和shapeit两个软件的结果

  3. 将pre-phasing的结果转化成VCF格式

  4. 选择reference panel,推荐1000G或者HRC

  5. 进行填充

实际操作中典型的用法如下

1. pre-phasing

以MACH为例,用法如下

mach1 \
-d Gwas.chr20.Unphased.dat \
-p Gwas.chr20.Unphased.ped \
--rounds 20 \
--states 200 \
--phase \
--interim 5 \
--sample 5 \
--prefix Gwas.Chr20.Phased.Output

MACH要求输入的分型结果格式为dat和ped格式,详细的解释参见以下链接

http://csg.sph.umich.edu/abecasis/Merlin/tour/input_files.html

2. convert to vcf

通过MACH2VCF进行格式转换,用法如下

mach2VCF \
--haps Gwas.Chr20.Phased.Output.hap \
--snps Gwas.Chr20.Phased.Output.snps \
--prefix Gwas.Chr20.Phased.Output.VCF.Format

该脚本可以从以下链接下载

ftp://share.sph.umich.edu/minimac3/Mach2VCF.v1.Source.Binary.tar.gz

3. impute

采用minimac4进行填充,用法如下

minimac4 \
--refHaps refPanel.m3vcf \
--haps Gwas.Chr20.Phased.Output.VCF.Format.vcf \
--prefix testRun \
--cpus 5

minimac4会自动将染色体拆分成不同的区间,在结合多线程,可以大大提高运行速度。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

这篇关于使用Minimac进行基因型填充的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/222848

相关文章

Python数据验证神器Pydantic库的使用和实践中的避坑指南

《Python数据验证神器Pydantic库的使用和实践中的避坑指南》Pydantic是一个用于数据验证和设置的库,可以显著简化API接口开发,文章通过一个实际案例,展示了Pydantic如何在生产环... 目录1️⃣ 崩溃时刻:当你的API接口又双叒崩了!2️⃣ 神兵天降:3行代码解决验证难题3️⃣ 深度

Linux内核定时器使用及说明

《Linux内核定时器使用及说明》文章详细介绍了Linux内核定时器的特性、核心数据结构、时间相关转换函数以及操作API,通过示例展示了如何编写和使用定时器,包括按键消抖的应用... 目录1.linux内核定时器特征2.Linux内核定时器核心数据结构3.Linux内核时间相关转换函数4.Linux内核定时

python中的flask_sqlalchemy的使用及示例详解

《python中的flask_sqlalchemy的使用及示例详解》文章主要介绍了在使用SQLAlchemy创建模型实例时,通过元类动态创建实例的方式,并说明了如何在实例化时执行__init__方法,... 目录@orm.reconstructorSQLAlchemy的回滚关联其他模型数据库基本操作将数据添

Spring配置扩展之JavaConfig的使用小结

《Spring配置扩展之JavaConfig的使用小结》JavaConfig是Spring框架中基于纯Java代码的配置方式,用于替代传统的XML配置,通过注解(如@Bean)定义Spring容器的组... 目录JavaConfig 的概念什么是JavaConfig?为什么使用 JavaConfig?Jav

Java使用Spire.Doc for Java实现Word自动化插入图片

《Java使用Spire.DocforJava实现Word自动化插入图片》在日常工作中,Word文档是不可或缺的工具,而图片作为信息传达的重要载体,其在文档中的插入与布局显得尤为关键,下面我们就来... 目录1. Spire.Doc for Java库介绍与安装2. 使用特定的环绕方式插入图片3. 在指定位

Springboot3 ResponseEntity 完全使用案例

《Springboot3ResponseEntity完全使用案例》ResponseEntity是SpringBoot中控制HTTP响应的核心工具——它能让你精准定义响应状态码、响应头、响应体,相比... 目录Spring Boot 3 ResponseEntity 完全使用教程前置准备1. 项目基础依赖(M

Java使用Spire.Barcode for Java实现条形码生成与识别

《Java使用Spire.BarcodeforJava实现条形码生成与识别》在现代商业和技术领域,条形码无处不在,本教程将引导您深入了解如何在您的Java项目中利用Spire.Barcodefor... 目录1. Spire.Barcode for Java 简介与环境配置2. 使用 Spire.Barco

Android使用java实现网络连通性检查详解

《Android使用java实现网络连通性检查详解》这篇文章主要为大家详细介绍了Android使用java实现网络连通性检查的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录NetCheck.Java(可直接拷贝)使用示例(Activity/Fragment 内)权限要求

C# 预处理指令(# 指令)的具体使用

《C#预处理指令(#指令)的具体使用》本文主要介绍了C#预处理指令(#指令)的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录1、预处理指令的本质2、条件编译指令2.1 #define 和 #undef2.2 #if, #el

C#中Trace.Assert的使用小结

《C#中Trace.Assert的使用小结》Trace.Assert是.NET中的运行时断言检查工具,用于验证代码中的关键条件,下面就来详细的介绍一下Trace.Assert的使用,具有一定的参考价值... 目录1、 什么是 Trace.Assert?1.1 最简单的比喻1.2 基本语法2、⚡ 工作原理3