基因测序、生物信息分析平台工作站硬件配置推荐2020

本文主要是介绍基因测序、生物信息分析平台工作站硬件配置推荐2020,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

(一)了解生物信息学
 
450853983.jpg

生物信息学(Bioinformatics)利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。

生物信息学典型工作流程

A730-SEQ.jpg
 
这个过程是由一系列链接的步骤组成,这些步骤将原始输入(测序原始数据RAW)转换为有意义或可解释的输出,例如,高通量测序NGS数据而生成的fastq文件。然后用于基因组序列分析的特定功能方面的特定工具执行。根据执行的分析类型,工作流可以具有可变数量的步骤,因此可以是简单的或复杂的。


生物信息学主要研究方向:DNA/RNA/蛋白质测序,序列比对,基因发现,基因组组装,药物设计,药物发现,蛋白质结构比对和预测,通过使用计算密集型技术(用于模式识别,数据挖掘,机器学习算法和可视化)来加深对生物过程的理解。因此需要配备先进的计算设备和丰富专业的分析软件

(二)生物信息学分析的计算特点

如何选购一个理想的图形工作站硬件配置,可能很多人思考过:
什么是用于生物信息学和计算生物学研究的最佳PC/工作站?
用于生物信息学分析的服务器配置
全基因组序列分析实验室的硬件配置
高通量序列分析服务器有什么要求
下一代测序数据分析硬件配置推荐
用于分析NGS宏基因组学数据的计算机配置?

2.1 生物信息分析的计算特点

生物信息数据分析涉及到基因组学、转录组学、蛋白质组学、宏基因组学、代谢物组学等,下图是全基因组数据分析流程

Genome02.png

生物信息学数据分析所涉及的计算主要是De novo的序列组装计算(Assembly)、重测序过程中的序列/映射比对计算(Mapping)

序列组装计算分析:
如果要进行从头组装(例如Velvet),假设一个人的全基因组测序数据,采用二代测序的方法,人的基因组3G,10倍数据30G,那么这30G的碱基,在切成更小的kmer,假设数据增加到了100G,还不算存储序列的一些其他信息,序列拼接的时候必须一次将所有数据同时存入内存,如果内存达不到100G,拼接根本无法完成。
因此,对于大型基因组装而言,需要的硬件资源特别多,不仅cpu要有足够的计算能力,内存在150G以上,但是如细菌基因组,数据集和基因组数据量不太大,内存128GB足够了

序列比对计算分析:
对于使用BWA/Bowtie等程序进行映射读取,对内存RAM要求不高(例如32GB即可),但CPU内核数量(及其频率)将决定计算过程需要多长时间。如果要进行大量对齐和比对(例如使用BWA),那么拥有大量CPU核心比拥有大量内存更为重要。
当然配置规格取决于您的预算和计划进行的分析类型。
RNASeq中计算量较大的就是比对步骤了,而比对往往只需要一次就可以! 一般32核CPU+64GB RAM硬件配置,可以满足对基因组/转录组/虹基因组分析的标准映射(maping)以及下游分析。

为了使NGS(下一代测序)分析的工作负荷最大化,硬件配置三个关键瓶颈:可用的CPU核数、内存容量以及I/O带宽

2.2 生信分析对硬件配置要求

如何处理454和Illumina数据? 全基因组装配/组装?序列拼接?映射读取到参考基因组?
(1)需要多少存储空间才能保持数据实时读取(硬盘容量)?
开发下一代测序(高通量测序)的临床应用的瓶颈是存储和分析所生成的大量数据。应用程序多种多样,但共同的主题在计算和分析上具有挑战性。
(2)要分析的每个文件有多大(RAM容量,硬盘读写速度)?
(3)要使用的软件准备好使用多处理器运行时间是否有要求(CPU核数)?

配置参考:
(1)基于基因组计划的大小

 

NO

基因组计划

配置参考

1

细菌(最高10MB)

32GB RAM,8个以上内核,10Gb磁盘空间

2

昆虫(高达500MB)

128GB RAM,16个以上内核,1Tb磁盘空间

3

禽类/小型植物基因组(最大1GB)

256GB RAM,32个以上内核,1TB磁盘空间

4

哺乳动物基因组(最大3GB)

512GBBb RAM,32个以上内核,3TB磁盘空间

5

植物基因组(高达30GB)

1TB RAM,64 +核,10Tb磁盘空间

 

(2)基于课题组研究人员数量

NO

课题组

配置参考

1

单人

16核+64G~256GB+ 8TB硬盘

2

1到5人课题组

64核+512GB内存+64TB硬盘

3

5人以上的课题组

100核以上+1TB内存+海量并行存储

 

 (三)生物信息学分析的硬件配置推荐
 

NO

品牌与型号

配置规格

价格

备注

1

H380 150128-10TA

85.0GHz /128GB DDR4 /QuaroP620 /1.9TB SSD系统盘 +10TB SATA企业级/塔式(750w)/23-高清图显

35000

 

2

AX400 142256-12TA

184.2GHz / 256GB DDR4 /QuaroP620 /1.9TB SSD系统盘 +12TB SATA企业级/塔式(750w)/23-高清图显

58500

 

3

EX630i 226256-20TA

2Xeon 5218R处理器(402.6GHz 256GB DDR4 /QuaroP620 /1.9TB SSD系统盘+20TB SATA企业级/塔式(865w)/23-高清图显

69990

 

4

EX630i 228384-20TA

2Xeon 6230R处理器(522.8GHz 384GB DDR4 /QuaroP620 /3.84TB SSD系统盘+20TB SATA企业级/塔式(865w)/23-高清图显

98000

 

5

Alpha730i 427512-42TA

4Xeon 5218处理器(722.7GHz 512GB DDR4 /QuaroP1000 /3.84TB SSD系统盘 +42TB并行存储/塔式(1400w冗余)/27"-4K图显

165000

 

6

Alpha730i 428512-70TA

4Xeon 6230处理器(802.8GHz 512GB DDR4 /QuaroP1000 /1.92TB SSD系统盘 +1TB高速缓存/70TB并行存储/塔式(1400w冗余)/27"-4K图显

199990

 

7

Alpha730i 432768-84TB

4Xeon 6248处理器(803.2GHz 768GB DDR4 /QuaroP1000 /1.92TB SSD系统盘 +2TB高速缓存/84TB并行存储/塔式(1400w冗余)/27"-4K图显

279000

 

8

Alpha730i 431768-84TB

4Xeon 白金8260处理器(963.1GHz 768GB DDR4 /QuaroP2000 /3.84TB SSD系统盘 +2TB高速缓存/98TB并行存储/塔式(1400w冗余)/27"-4K图显

330000

 

9

Alpha730i 4341T-112TB

4Xeon 白金8270处理器(1043.4GHz 1TB DDR4 /QuaroP2000 /3.84TB SSD系统盘 +4TB高速缓存/112TB并行存储/塔式(1400w冗余)/27"-4K图显

428000

 

10

Alpha730i 4332T-112TB

4Xeon 白金8280处理器(1123.3GHz 1.5TB DDR4 /QuaroP2000 /3.84TB SSD系统盘 +4TB高速缓存/112TB并行存储/塔式(1400w冗余)/27"-4K图显

585000

 

 

 

欢迎测试验证

 

这篇关于基因测序、生物信息分析平台工作站硬件配置推荐2020的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/757098

相关文章

mybatis映射器配置小结

《mybatis映射器配置小结》本文详解MyBatis映射器配置,重点讲解字段映射的三种解决方案(别名、自动驼峰映射、resultMap),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定... 目录select中字段的映射问题使用SQL语句中的别名功能使用mapUnderscoreToCame

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

SpringBoot 多环境开发实战(从配置、管理与控制)

《SpringBoot多环境开发实战(从配置、管理与控制)》本文详解SpringBoot多环境配置,涵盖单文件YAML、多文件模式、MavenProfile分组及激活策略,通过优先级控制灵活切换环境... 目录一、多环境开发基础(单文件 YAML 版)(一)配置原理与优势(二)实操示例二、多环境开发多文件版

Vite 打包目录结构自定义配置小结

《Vite打包目录结构自定义配置小结》在Vite工程开发中,默认打包后的dist目录资源常集中在asset目录下,不利于资源管理,本文基于Rollup配置原理,本文就来介绍一下通过Vite配置自定义... 目录一、实现原理二、具体配置步骤1. 基础配置文件2. 配置说明(1)js 资源分离(2)非 JS 资

MySQL8 密码强度评估与配置详解

《MySQL8密码强度评估与配置详解》MySQL8默认启用密码强度插件,实施MEDIUM策略(长度8、含数字/字母/特殊字符),支持动态调整与配置文件设置,推荐使用STRONG策略并定期更新密码以提... 目录一、mysql 8 密码强度评估机制1.核心插件:validate_password2.密码策略级

ShardingProxy读写分离之原理、配置与实践过程

《ShardingProxy读写分离之原理、配置与实践过程》ShardingProxy是ApacheShardingSphere的数据库中间件,通过三层架构实现读写分离,解决高并发场景下数据库性能瓶... 目录一、ShardingProxy技术定位与读写分离核心价值1.1 技术定位1.2 读写分离核心价值二

QT Creator配置Kit的实现示例

《QTCreator配置Kit的实现示例》本文主要介绍了使用Qt5.12.12与VS2022时,因MSVC编译器版本不匹配及WindowsSDK缺失导致配置错误的问题解决,感兴趣的可以了解一下... 目录0、背景:qt5.12.12+vs2022一、症状:二、原因:(可以跳过,直奔后面的解决方法)三、解决方

SpringBoot路径映射配置的实现步骤

《SpringBoot路径映射配置的实现步骤》本文介绍了如何在SpringBoot项目中配置路径映射,使得除static目录外的资源可被访问,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一... 目录SpringBoot路径映射补:springboot 配置虚拟路径映射 @RequestMapp

Nginx中配置使用非默认80端口进行服务的完整指南

《Nginx中配置使用非默认80端口进行服务的完整指南》在实际生产环境中,我们经常需要将Nginx配置在其他端口上运行,本文将详细介绍如何在Nginx中配置使用非默认端口进行服务,希望对大家有所帮助... 目录一、为什么需要使用非默认端口二、配置Nginx使用非默认端口的基本方法2.1 修改listen指令