【Nature. Mach. Intell. 】基于Transformer的多肽-HLA I类结合预测和疫苗的新生抗原序列设计...

本文主要是介绍【Nature. Mach. Intell. 】基于Transformer的多肽-HLA I类结合预测和疫苗的新生抗原序列设计...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

f8f740662d34158d340e645821168c2f.png

来源:专知
本文1000字,建议阅读5分钟TransPHLA设计了Transformer衍生模型来预测pHLA的结合。

近日,国际知名期刊《Nature Machine Intelligence》在线发表了上海交通大学生命科学技术学院魏冬青团队的研究论文《A transformer-based model to predict peptide–HLA class I binding and optimize mutated peptides for vaccine design》。生命科学技术学院2017级博士研究生褚晏伊和香港大学深圳医院的张艳博士为该论文的共同第一作者。生命科学技术学院魏冬青教授和熊毅副研究员为该论文的共同通讯作者。

8584194c20db0241aa95349c428f64eb.png

人类白细胞抗原(HLA)和肽(pHLA)之间相互作用的计算预测可以加快表位筛选和疫苗。该研究开发了TransMut框架,包含了用于pHLA结合预测的TransPHLA和用于突变肽优化的AOMP程序,它可以推广到生物分子的任何结合和突变任务(图1)。

TransPHLA设计了Transformer衍生模型来预测pHLA的结合。在pHLA结合预测、新抗原鉴定和HPV疫苗鉴定方面,TransPHLA均优于现有的14种方法。基于TransPHLA开发的AOMP程序可用于疫苗设计,它可以自动优化突变肽,以搜索对目标HLA具有更高亲和力并与源肽具有高度同源性的突变肽。在3660个非结合pHLA中,有3630个源肽被成功突变。其中,94%通过IEDB的推荐方法得到验证,88%与源肽的同源性高于80%。

11b8a377d59456353abd22e9619e41b0.png

图1.TransMut框架在webserver上的输入和输出

1.数据集

该研究包含112种HLA,肽长度从8到14,共有366种HLA-肽长度组合。详情见图2和图3。

aef81243dbc8cce0eb98ccb13796d658.png

图2.不同数据集中每个HLA相关的可结合的pHLA样本数

cd31219a84d1822d88923d1172a540e8.png

图3.不同数据集中肽长度相关的可结合的pHLA样本数

2.TransPHLA模型

TransPHLA的核心思想是自注意力机制的应用。TransPHLA由以下四个模块组成(图4):首先使用embedding block将positional embedding添加到amino acid embedding中,以生成sequence embedding,然后应用dropout技术来增强鲁棒性。通过embedding block,TransPHLA分别生成肽和HLA的embedding。接下来,这些embedding将分别作为Encoder block的输入。Encoder block包含masked multi-head self-attention mechanism和feature optimization block。Feature optimization block是先上升后下降的全连接层的组合,这个模块使得注意力机制得到的特征表示更好。然后,将输出的肽和HLA的特征表示连接,作为pHLA的embedding。在pHLA的embedding通过encoder block后,使用projection block预测pHLA的结合分数。

5a1801509d744baff9df549f9bc01077.png

图4.TransPHLA模型图

论文链接:

https://www.nature.com/articles/s42256-022-00459-7

参考链接:

https://news.sjtu.edu.cn/jdzh/20220325/169006.html

d7402b3e763ca59051441924c5b33d55.png

这篇关于【Nature. Mach. Intell. 】基于Transformer的多肽-HLA I类结合预测和疫苗的新生抗原序列设计...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900904

相关文章

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

MyBatis设计SQL返回布尔值(Boolean)的常见方法

《MyBatis设计SQL返回布尔值(Boolean)的常见方法》这篇文章主要为大家详细介绍了MyBatis设计SQL返回布尔值(Boolean)的几种常见方法,文中的示例代码讲解详细,感兴趣的小伙伴... 目录方案一:使用COUNT查询存在性(推荐)方案二:条件表达式直接返回布尔方案三:存在性检查(EXI

利用Python实现时间序列动量策略

《利用Python实现时间序列动量策略》时间序列动量策略作为量化交易领域中最为持久且被深入研究的策略类型之一,其核心理念相对简明:对于显示上升趋势的资产建立多头头寸,对于呈现下降趋势的资产建立空头头寸... 目录引言传统策略面临的风险管理挑战波动率调整机制:实现风险标准化策略实施的技术细节波动率调整的战略价

使用Python自动化生成PPT并结合LLM生成内容的代码解析

《使用Python自动化生成PPT并结合LLM生成内容的代码解析》PowerPoint是常用的文档工具,但手动设计和排版耗时耗力,本文将展示如何通过Python自动化提取PPT样式并生成新PPT,同时... 目录核心代码解析1. 提取 PPT 样式到 jsON关键步骤:代码片段:2. 应用 JSON 样式到

PostgreSQL 序列(Sequence) 与 Oracle 序列对比差异分析

《PostgreSQL序列(Sequence)与Oracle序列对比差异分析》PostgreSQL和Oracle都提供了序列(Sequence)功能,但在实现细节和使用方式上存在一些重要差异,... 目录PostgreSQL 序列(Sequence) 与 oracle 序列对比一 基本语法对比1.1 创建序

Python结合PyWebView库打造跨平台桌面应用

《Python结合PyWebView库打造跨平台桌面应用》随着Web技术的发展,将HTML/CSS/JavaScript与Python结合构建桌面应用成为可能,本文将系统讲解如何使用PyWebView... 目录一、技术原理与优势分析1.1 架构原理1.2 核心优势二、开发环境搭建2.1 安装依赖2.2 验

Python Transformer 库安装配置及使用方法

《PythonTransformer库安装配置及使用方法》HuggingFaceTransformers是自然语言处理(NLP)领域最流行的开源库之一,支持基于Transformer架构的预训练模... 目录python 中的 Transformer 库及使用方法一、库的概述二、安装与配置三、基础使用:Pi

Spring Boot项目中结合MyBatis实现MySQL的自动主从切换功能

《SpringBoot项目中结合MyBatis实现MySQL的自动主从切换功能》:本文主要介绍SpringBoot项目中结合MyBatis实现MySQL的自动主从切换功能,本文分步骤给大家介绍的... 目录原理解析1. mysql主从复制(Master-Slave Replication)2. 读写分离3.

C++从序列容器中删除元素的四种方法

《C++从序列容器中删除元素的四种方法》删除元素的方法在序列容器和关联容器之间是非常不同的,在序列容器中,vector和string是最常用的,但这里也会介绍deque和list以供全面了解,尽管在一... 目录一、简介二、移除给定位置的元素三、移除与某个值相等的元素3.1、序列容器vector、deque

Python结合Flask框架构建一个简易的远程控制系统

《Python结合Flask框架构建一个简易的远程控制系统》这篇文章主要为大家详细介绍了如何使用Python与Flask框架构建一个简易的远程控制系统,能够远程执行操作命令(如关机、重启、锁屏等),还... 目录1.概述2.功能使用系统命令执行实时屏幕监控3. BUG修复过程1. Authorization