HiC-Pro的Singularity简明使用指南

2024-06-23 19:48

本文主要是介绍HiC-Pro的Singularity简明使用指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关于原理部分和更详细的介绍,见HiC-Pro: Hi-C数据预处理高效工具, 这里只介绍如何快速使用Singularity的HiC-Pro进行数据分析。

关键内容就是,config-hicpro.txt 里的文件路径信息都必须是绝对路径,否则默认都位于annotation目录下。切记,切记,切记。

第零步: Singularity的HiC-Pro镜像下载,

# 下载
mkdir -p /opt/biosoft/HiC-Pro 
cd /opt/biosoft/HiC-Pro 
wget https://zerkalo.curie.fr/partage/HiC-Pro/singularity_images/hicpro_latest_ubuntu.img
# 使用
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -h

第一步:建立输入数据文件夹, 数据不能是软连接形式,只能是复制或者移动

mkdir -p fastq/xxx
cp xxx_R1.fastq.gz xxx_R2.fastq.gz  fastq/xxx/
# 如果有多个样本
mkdir -p fastq/yyy
cp yyy_R1.fastq.gz yyy_R2.fastq.gz  fastq/yyy/

第二步:创建参考数据库,需要修改ENZYME

ENZYME=DpnII
# build reference
mkdir reference
mv 你的参考序列.fasta  reference/genome.fa
# enzyme site
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \/usr/local/bin/HiC-Pro_2.11.4/bin/utils/digest_genome.py -r $ENZYME \-o reference/genome_${ENZYME}.bed reference/genome.fa
# genome size
seqkit fx2tab -nl reference/genome.fa | awk '{print $1"\t"$2}' > reference/genome.chrom.size
# bowtie/2.3.4.3
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \bowtie2-build --threads 60 reference/genome.fa reference/genome

第三步: 复制配置文件并修改

# config
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \cp /usr/local/bin/HiC-Pro_2.11.4/config-hicpro.txt  config-hicpro.txt

修改其中的如下项,

  • N_CPU=80 线程数
  • BOWTIE2_IDX_PATH: 必须是绝对路径,例如 /home/xzg/reference
  • REFERENCE_GENOME=genome
  • GENOME_SIZE=必须是绝对路径, 例如/home/xzg/reference/genome.chrom.size
  • GENOME_FRAGMENT= 必须是绝对路径 例如/home/xzg/reference/genome_DpnII.bed
  • LIGATION_SITE=根据实际酶切位点来, 例如DpnII和MBoI都是GATCGATC

第四步:运行

singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -i fastq -o results -c config-hicpro.txt ```

这篇关于HiC-Pro的Singularity简明使用指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1088106

相关文章

Spring WebFlux 与 WebClient 使用指南及最佳实践

《SpringWebFlux与WebClient使用指南及最佳实践》WebClient是SpringWebFlux模块提供的非阻塞、响应式HTTP客户端,基于ProjectReactor实现,... 目录Spring WebFlux 与 WebClient 使用指南1. WebClient 概述2. 核心依

sqlite3 命令行工具使用指南

《sqlite3命令行工具使用指南》本文系统介绍sqlite3CLI的启动、数据库操作、元数据查询、数据导入导出及输出格式化命令,涵盖文件管理、备份恢复、性能统计等实用功能,并说明命令分类、SQL语... 目录一、启动与退出二、数据库与文件操作三、元数据查询四、数据操作与导入导出五、查询输出格式化六、实用功

Python虚拟环境与Conda使用指南分享

《Python虚拟环境与Conda使用指南分享》:本文主要介绍Python虚拟环境与Conda使用指南,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、python 虚拟环境概述1.1 什么是虚拟环境1.2 为什么需要虚拟环境二、Python 内置的虚拟环境工具

Java JSQLParser解析SQL的使用指南

《JavaJSQLParser解析SQL的使用指南》JSQLParser是一个Java语言的SQL语句解析工具,可以将SQL语句解析成为Java类的层次结构,还支持改写SQL,下面我们就来看看它的具... 目录一、引言二、jsQLParser常见类2.1 Class Diagram2.2 Statement

正则表达式r前缀使用指南及如何避免常见错误

《正则表达式r前缀使用指南及如何避免常见错误》正则表达式是处理字符串的强大工具,但它常常伴随着转义字符的复杂性,本文将简洁地讲解r的作用、基本原理,以及如何在实际代码中避免常见错误,感兴趣的朋友一... 目录1. 字符串的双重翻译困境2. 为什么需要 r?3. 常见错误和正确用法4. Unicode 转换的

Python Selenium动态渲染页面和抓取的使用指南

《PythonSelenium动态渲染页面和抓取的使用指南》在Web数据采集领域,动态渲染页面已成为现代网站的主流形式,本文将从技术原理,环境配置,核心功能系统讲解Selenium在Python动态... 目录一、Selenium技术架构解析二、环境搭建与基础配置1. 组件安装2. 驱动配置3. 基础操作模

Spring Validation中9个数据校验工具使用指南

《SpringValidation中9个数据校验工具使用指南》SpringValidation作为Spring生态系统的重要组成部分,提供了一套强大而灵活的数据校验机制,本文给大家介绍了Spring... 目录1. Bean Validation基础注解常用注解示例在控制器中应用2. 自定义约束验证器定义自

售价599元起! 华为路由器X1/Pro发布 配置与区别一览

《售价599元起!华为路由器X1/Pro发布配置与区别一览》华为路由器X1/Pro发布,有朋友留言问华为路由X1和X1Pro怎么选择,关于这个问题,本期图文将对这二款路由器做了期参数对比,大家看... 华为路由 X1 系列已经正式发布并开启预售,将在 4 月 25 日 10:08 正式开售,两款产品分别为华

Python Websockets库的使用指南

《PythonWebsockets库的使用指南》pythonwebsockets库是一个用于创建WebSocket服务器和客户端的Python库,它提供了一种简单的方式来实现实时通信,支持异步和同步... 目录一、WebSocket 简介二、python 的 websockets 库安装三、完整代码示例1.

Kotlin 作用域函数apply、let、run、with、also使用指南

《Kotlin作用域函数apply、let、run、with、also使用指南》在Kotlin开发中,作用域函数(ScopeFunctions)是一组能让代码更简洁、更函数式的高阶函数,本文将... 目录一、引言:为什么需要作用域函数?二、作用域函China编程数详解1. apply:对象配置的 “流式构建器”最