Alphafold2蛋白质结构预测AI工作站配置推荐

2024-01-12 02:20

本文主要是介绍Alphafold2蛋白质结构预测AI工作站配置推荐,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

AlphaFold2计算特点

       蛋白质三维结构预测是一项计算量非常巨大的任务,科学家多年的探索研究,形成了X射线晶体学法、核磁共振法、冷冻电镜等。
       2021年底,谷歌的DeepMind团队的采用人工智能方法的AlphaFold2算法在生物界引起了极大的轰动,它能准确地预测蛋白质的结构,AlphaFold2是当今预测蛋白质3D结构的最强工具。它将被大量用于推动世界蛋白质研究向前发展。

        AlphaFold2在国际蛋白质结构预测竞赛(CASP14)上精确地基于氨基酸序列预测蛋白质的3D结构。其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。

目前情况(大致统计):
(1)Deepmind开源了AlphaFold2的源代码(推理部分)
(2)华盛顿大学开源了RoseTTRFold的源代码(推理部分)
(3)深势科技复现了AlphaFold的训练部分,并开源代码(训练和推理)
(4)上海天壤智能科技有限公司复现了TRfold训练部分和推理部分
(5)上海交大对AlphaFold2的推理代码进行了优化(推理并行版)

(一)AlphaFold2蛋白质结构预测计算特点
如何配置好硬件,最快速度完成训练、推理计算,首先分析其计算过程以及算法特点。

                                                      图1 Alphafold2计算示意图

环节1 数据处理-序列特征生成计算特点

                                     (图片2来源:上海交大alphafold2并行优化版)

计算过程
总输入单个蛋白质序列FASTA格式(推理);
通过搜索工具(jackHMMER/HHblits)分别对多个遗传数据库--执行隐马尔可夫模型的搜索生成MSA(序列-残基);见图1
搜索的结构和序列产生的Pairing信息(残基-残基);
通过HHsearch搜索的Template;

计算与硬件配置分析
数据库搜索过程涉及数据库密集I/O读写,数据放到高速SSD硬盘上,数据量累积超过2TB,非常耗时,加速手段提升CPU计算速度。

硬件配置
CPU计算为主,内存要够大,或配备NVME SSD固态卡,容量4TB以上
环节2 神经网络预测计算特点

(图片来源:上海交通大学 https://parafold.sjtu.edu.cn/docs/quick-start/)

计算过程
利用多序列比对(MSA),把蛋白质的结构和生物信息整合到深度学习算法中,主要包括:神经网络EvoFormer和结构模块(Structure module).
在EvoFormer中,主要是将图网络(Graph networks)和多序列比对(MSA)结合完成结构预测,Alphafold2使用Transformer结构,不管是MSA还是残基-残基对的信息更新都使用了Attention机制,结构模块的更新使用了三角法则,简化了计算的复杂度,准确率也提高了不少.
结构模块(Structure Module)主要工作是将EvoFormer得到的信息转换为蛋白质3D结构.
整个模型的Evoformer和Structure module部分都使用了Recycling,即将输出重新加入到输入在重复refinement,进行信息的精炼.
计算特点
上述计算过程用GPU更合理,对GPU要求是高显存带宽、大容量显存、大蛋白质计算通过将多GPU卡设置统一内存架构,大的显存可支持更大的计算数据存放。

计算架构分析汇总

(二)蛋白质结构预算AI工作站配置推荐:

       西安坤隆计算机科技有限公司专注于工作站专业应用,对每个应用的计算过程研究分析,给出精准高效、高可靠计算架构和专业系统优化,以及稳定的技术支持,保证与应用软件90%以上的匹配吻合,和长期稳定运行。

硬件配置具有以下特点:
1)配备CPU规格均以高频为主,兼顾足够CPU核数,这样保证数据预处理(最慢的环节),计算时间大幅缩短,GPU卡采用单精度指标高的、显存容量大的,保证神经预测计算加速,满足AlphaFold2的理想的配置方案
2)整机的cpu、gpu、硬盘配置,满足AlphaFold2推理(包括上海交大并行版)计算要求,均衡无死角,性能最大化;
3)为深势科技的Uni-Fold训练、推理模块提供理想配置架构;
4)每个配置机器做到即开即用,并提供硬件+优化+稳定高速运行技术支持服务
5)支持大规模的计算扩展应用需求

2.1 蛋白质结构预测工作站配置参考

​​​​​​​

​​​​​​​

这篇关于Alphafold2蛋白质结构预测AI工作站配置推荐的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/596499

相关文章

win10安装及配置Gradle全过程

《win10安装及配置Gradle全过程》本文详细介绍了Gradle的下载、安装、环境变量配置以及如何修改本地仓库位置,通过这些步骤,用户可以成功安装并配置Gradle,以便进行项目构建... 目录一、Gradle下载1.1、Gradle下载地址1.2、Gradle下载步骤二、Gradle安装步骤2.1、安

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

Redis中Set结构使用过程与原理说明

《Redis中Set结构使用过程与原理说明》本文解析了RedisSet数据结构,涵盖其基本操作(如添加、查找)、集合运算(交并差)、底层实现(intset与hashtable自动切换机制)、典型应用场... 目录开篇:从购物车到Redis Set一、Redis Set的基本操作1.1 编程常用命令1.2 集

mysql8.0.43使用InnoDB Cluster配置主从复制

《mysql8.0.43使用InnoDBCluster配置主从复制》本文主要介绍了mysql8.0.43使用InnoDBCluster配置主从复制,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录1、配置Hosts解析(所有服务器都要执行)2、安装mysql shell(所有服务器都要执行)3、

java程序远程debug原理与配置全过程

《java程序远程debug原理与配置全过程》文章介绍了Java远程调试的JPDA体系,包含JVMTI监控JVM、JDWP传输调试命令、JDI提供调试接口,通过-Xdebug、-Xrunjdwp参数配... 目录背景组成模块间联系IBM对三个模块的详细介绍编程使用总结背景日常工作中,每个程序员都会遇到bu

macOS彻底卸载Python的超完整指南(推荐!)

《macOS彻底卸载Python的超完整指南(推荐!)》随着python解释器的不断更新升级和项目开发需要,有时候会需要升级或者降级系统中的python的版本,系统中留存的Pytho版本如果没有卸载干... 目录MACOS 彻底卸载 python 的完整指南重要警告卸载前检查卸载方法(按安装方式)1. 卸载

JDK8(Java Development kit)的安装与配置全过程

《JDK8(JavaDevelopmentkit)的安装与配置全过程》文章简要介绍了Java的核心特点(如跨平台、JVM机制)及JDK/JRE的区别,重点讲解了如何通过配置环境变量(PATH和JA... 目录Java特点JDKJREJDK的下载,安装配置环境变量总结Java特点说起 Java,大家肯定都

linux配置podman阿里云容器镜像加速器详解

《linux配置podman阿里云容器镜像加速器详解》本文指导如何配置Podman使用阿里云容器镜像加速器:登录阿里云获取专属加速地址,修改Podman配置文件并移除https://前缀,最后拉取镜像... 目录1.下载podman2.获取阿里云个人容器镜像加速器地址3.更改podman配置文件4.使用po

Vue3 如何通过json配置生成查询表单

《Vue3如何通过json配置生成查询表单》本文给大家介绍Vue3如何通过json配置生成查询表单,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录功能实现背景项目代码案例功能实现背景通过vue3实现后台管理项目一定含有表格功能,通常离不开表单