最新科研技术:CADD分子对接、虚拟筛选等/AIDD模型构建和数据分析能力/蛋白晶体结构解析:分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构

本文主要是介绍最新科研技术:CADD分子对接、虚拟筛选等/AIDD模型构建和数据分析能力/蛋白晶体结构解析:分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

“AI for Science”作为科研范式的重大改变,给生命科学机理探索和药物研发带来变革性的洞见和视角的同时,也带来更丰富的研究工具和研究方法。以计算生物、计算机辅助药物设计(CADD)、AI药物发现(AIDD)为代表的计算驱动手段相继在生物机理的探索、靶标发现和精准医疗、药物发现与设计等领域取得了显著的进步。AI4S与生物计算分论坛,聚焦探索AI与生命科学、药物研发的深度融合,报告嘉宾在蛋白质从头设计、CADD与AIDD中结构数据的有效利用、蛋白复合物结构预测模型的完全开源、AI赋能医药研发、新药设计的挑战与机遇等AI for Life Science前沿领域进行了分享。AI4S与生物计算分论坛,进一步加快AI4S在生命科学的扩散,加深生命科学领域的科学家、工程师对AI4S的理解和认知,催化AI4S与生命科学、生物计算的迅速融合。

蛋白质结构解析的传统方法与研究进展,以及新兴的互联网技术与计算机算法为蛋白质科学研究领域带来的影响与对未来展望。诸如此类的的基础研究对农业的发展是必不可少的,除此之外,通过多种生物信息学工具预测蛋白质之间的的相互作用,不仅可以为接下来作物抗病育种的研究带来理论支撑,也在一定程度上反应传统农业研究与互联网时代农业研究在各个分面的差别

一、科研背景

CADD计算机辅助药物设计

依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,针对这些基础研究中所揭示的包括酶、受体、离子通道及核酸等潜在的药物设计靶点,并参考其它类源性配体或天然产物的化学结构特征,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,CADD的应用,包括基于结构的药物设计(SBDD)、基于配体的药物设计(LBDD)、高通量虚拟筛选(HTVS)等技术,突破了传统的先导物发现模式,极大地促进了先导化合物发现和优化。特别是在食品、生物、化学、医药、植物、疾病方面应用广泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。CADD的应用可以加快靶点发现的速度,提高靶点发现的准确度,从而推进新药研

AIDD人工智能药物发现与设计

是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。随着医药大数据的积累和人工智能技术的发展,运用AI技术并结合大数据的精准药物设计也不断推动着创新药物的发展。在新型冠状病毒的治疗方案中,通过一系列计算机辅助药物生物计算的方法发现一大类药物分子可以有效阻止新冠病毒的侵染,为治疗新冠提供了新思路。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒

蛋白质晶体结构解析

近年来结构生物学发展迅速并和其他学科相互渗透交叉,特别是受到结构基因组学等热点学科的极大带动。作为结构生物学的基本手段和技术,蛋白质晶体学从解析简单的蛋白质三维结构延伸到解决各类生物大分子及复合物结构,并更加注重研究结构与功能之间的相互关系,派生出诸如基于结构的药物设计等应用性很强的分支。生物技术及计算机技术的飞速发展,尤其是高通量技术在生物学领域的应用,为蛋白质晶体学带来了全新的概念和更加广阔的前景

二、学习目标

CADD计算机辅助药物设计:能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟

AIDD人工智能药物发现与设计:了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力。

蛋白质晶体结构解析:了解蛋白质晶体结构解析的原理、方法与技术,学习分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构。很轻松地解析出蛋白晶体结构,并进行晶体结构的精修

四、内容

一、CADD计算机辅助药物设计

第一天上午

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.4靶点蛋白的下载与预处理

1.5批量下载蛋白晶体结构

2.Pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1 优势及主要功能介绍

3.2 界面和基本操作介绍

3.3插件安装使用

下午

一般的蛋白

-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天

拓展对接的使用方法

1.蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点

PD-1/PD-L1等为例。

2.涉及金属酶蛋白的对接

2.1 金属酶蛋白-配体的背景介绍

2.2蛋白与配体分子的收集与预处理

2.3金属离子的处理

2.4金属辅酶蛋白-配体的对接

2.5结果分析

以人类法尼基转移酶及其抑制剂为例

3.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

α-糖苷转移酶和多糖分子对接为例

5.核酸-小分子对接

5.1核酸-小分子的应用现状

5.2相关的程序介绍

5.3核酸-小分子的结合种类

5.4核酸-小分子对接

5.5相关结果的分析

以人端粒

g -四链和配体分子对接为例。

操作流程介绍及实战演示

第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶

2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。

3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白

(AChBP)与尼古丁复合物为例

第五天

分子动力学模拟(linux与gromacs使用安装)

1. linux系统的介绍和简单使用

1.1 linux常用命令行

1.2 linux上的常用程序安装

1.3 体验:如何在linux上进行虚拟筛选

2.分子动力学的理论介绍

2.1分子动力学模拟的原理

2.2分子动力学模拟的方法及相关程序

2.3相关力场的介绍

3.gromacs使用及介绍

重点:主要命令及参数的介绍

4.origin介绍及使用

第六天

溶剂化分子动力学模拟的执行

1.一般的溶剂化蛋白的处理流程

2.蛋白晶体的准备

3.结构的能量最小化

4.对体系的预平衡

5.无限制的分子动力学模拟

6.分子动力学结果展示与解读

以水中的溶菌酶为例

第七天

蛋白-配体分子动力学模拟的执行

1.蛋白-配体在分子动力学模拟的处理流程

2.蛋白晶体的准备

3.蛋白-配体模拟初始构象的准备

4.配体分子力场拓扑文件的准备

4.1 高斯的简要介绍

4.2 ambertool的简要介绍

4.3生成小分子的力场参数文件

5.对复合物体系温度和压力分别限制的预平衡

6.无限制的分子动力学模拟

7.分子动力学结果展示与解读

8.轨迹后处理及分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

下方为部分案例图:

二、AIDD人工智能药物发现与设计

(第一天)

人工智能与药物发现

用工具的介绍与安装

从CADD到AIDD的介绍

1.计算机辅助药物设计(CADD)简介

1.2.分子对接与分子动力学背景介绍

1.3.人工智能药物发现(AIDD)简介

2.机器学习与深度学习在药物发现中的背景介绍

2.1药物发现与设计

2.2基于结构的药物发现与设计

2.3基于配体的药物发现与设计

3.1Anaconda3/Pycharm安装

3.2python 编程基础

3.3Pandas基础

3.4NumPy基础

3.5RDKit基础

3.6Pytorch基础

3.7Tensorflow基础

3.8DeepChem基础

(第二天)

机器学习与药物发现(分类任务)

1.分类模型的构建与应用

1.1逻辑回归算法原理

1.2朴素贝叶斯算法原理

1.3k最近邻算法原理

1.4支持向量机算法原理

1.5随机森林算法原理

1.6梯度提升算法原理

1.7多层感知机算法原理

1.8特征工程

1.9缺失值填补

2.特征归一化

2.1变量筛选

2.2模型评估方法

2.3交叉验证

2.4外部验证

3.分类模型的常用评价指标

3.1混淆矩阵

3.2准确率

3.3敏感性

3.4特异性

3.5模型选择

3.6格点搜索超参数调优

3.7k折交叉验证

分类模型的实例讲解与练习,以给定数据集为例,讲解基于以上机器学习算法的生物活性或ADMET性质预测模型。引导学员构建自己的数据模型,并用于小分子化合物的活性或ADMET性质预测。

(第三天)

机器学习与药物发现(回归任务)

1.随机森林回归

2.支持向量机回归

3.XGboost回归

4.多层感知机回归

5.神经网络回归

6.回归模型的常用评价指标

6.1MSE

6.2RMSE

6.3MAE

6.4R2

QSAR/3D-QSAR模型

以给定数据集为例,讲解基于上述几种机器学习算法构建生物活性如pIC50或ADMET性质预测模型。

(第四天)

深度学习与药物发现

1.深度学习的发展历程与在药物开发中的应用

1.1多层感知机/人工神经网络

1.2基于梯度的学习

1.3反向传播算法

1.4随机梯度下降

1.5卷积神经网络介绍

1.6图神经网络介绍

基于PyTorch的多层感知机算法的实例讲解与练习

以给定数据集为例,讲解基于多层感知机的化合物性质预测模型。

以给定数据集为例,讲解基于卷积神经网络的化合物图像预测分类模型。

以给定数据集为例,讲解基于图神经网络对化合物的毒性分类预测模型。

(第五天)

分子生成模型

1.生成式对抗网络(GANs)的基本原理

1.2生成器

1.3判别器

1.4循环神经网络(RNN)

1.5长短期记忆网络(LSTM)

2.基于上下文的循环神经网络序列建模

3.基于字符串的小分子化合物生成模型

4.基于图数据的小分子化合物生成模型

实例讲解与练习,以给定数据集为例,构建分子生成模型。

三、蛋白质晶体结构解析

第一天

蛋白质结晶前准备

1. 目的蛋白质信息检索(包括实操演示)

1.1 不同种属的蛋白

1.2 蛋白质一级结构的调查

1.3 蛋白质三级结构的预测

1.4 蛋白质理化特性的预测

1.5 蛋白质的配体和共价修饰

2. 分子克隆技术

2.1 目的基因的获取(包括实操演示)

2.2 目的基因的引物设计(包括实操演示)

2.3 传统克隆技术(涉及学习SnapGene软件,包括实操演示)

2.4 无缝克隆技术(涉及学习SnapGene软件,包括实操演示)

以某一基因进行操作演示

3. 利用大肠杆菌表达目的蛋白

3.1 目的蛋白的小量鉴定表达

3.2 目的蛋白的大量表达

3.3 收菌和裂解菌体

3.4 裂解液的离心

3.5 目的蛋白的浓缩

3.6 目的蛋白浓度的测定

4. 真核表达系统

第二天

蛋白质结晶技术

1. 蛋白晶体结构的特征

1.1 蛋白晶体的空间格子、晶胞和晶面指标

1.2 蛋白晶体的对称性、点群、晶系和空间群

2. 蛋白质晶体生长的理论知识(详细讲解温度、pH值、离子强度、有机溶剂、沉淀剂,等等,对蛋白晶体生长的影响;影响蛋白质晶型的因素)

3. 蛋白质晶体生长条件的初筛(详细讲解晶体初筛的注意事项)

4. 蛋白质晶体生长条件的优化 (详细讲解晶体优化的方法,包括改变pH值、沉淀剂,等因素)

5. 晶种法优化蛋白质晶体生长条件

6. 蛋白晶体的挑选和防冻液的配制

第三天

蛋白晶体衍射数据收集

1. X射线衍射

1.1. X射线衍射原理

1.2. X射线衍射的电子密度

1.3. 晶体结构解析的相角问题

2. 上海光源线站BL18U1、BL19U1和BL02U1收集数据的方法 (重点详细讲解,可能需要更长的时间)

3. 蛋白晶体结构解析软件的安装(包括Ubuntu系统、Phenix软件、CCP4软件、PyMoL软件、XDS软件和Adxv软件)

第四天

蛋白晶体结构解析

1.晶体结构的解析

1.1. 晶体结构解析流程

1.2. Index、Intergrate和Scale

1.3. 分子置换技术(包括实操演示)

1.4. 蛋白晶体结构的重建(包括实操演示)

1.5. 蛋白晶体结构的优化(包括实操演示)

2. 晶体结构的精修(涉及COOT软件、Phenix软件和CCP4软件,包括实操演示)

3. 晶体结构质量的评价指标(详细讲解各个评价指标)

4. 蛋白质结构中加入小分子配体

5. 在结构解析过程中,如何利用软件提高分辨率(重点讲解,需要较长的时间)

第五天

蛋白晶体结构的提交及展示

1. 从晶体生长到解析,详细剖析提高分辨率的方法(包括示例演示)

2. 蛋白晶体结构数据提交到PDB(包括实操演示)

3. 蛋白晶体结构的展示(包括实操演示)

六、时间

CADD计算机辅助药物设计

2023.7.29 -----2023.7.30 全天(上午09.00-11.30 下午13.30-17.00)

2023.8.1-----2023.8.4晚上(晚上19.00-22.00)

2023.8.5-----2023.8.6全天(上午09.00-11.30 下午13.30-17.00)

2023.8.8-----2023.8.9晚上(晚上19.00-22.00)

AIDD人工智能药物发现与设计

2023.8.5 -----2023.8.6 全天(上午09.00-11.30 下午13.30-17.00)

2023.8.8-----2023.8.9晚上(晚上19.00-22.00)

2023.8.12-----2023.8.13全天(上午09.00-11.30 下午13.30-17.00)

蛋白质晶体结构解析

2023.08.01----2023.08.04晚上(晚上19.00-22.00)

2023.08.05 -----2023.08.06 全天(上午09.00-11.30 下午13.30-17.00)

2023.08.08-----2023.08.09晚上(晚上19.00-22.00)

实操及科研问题

往期参会单位

有来自四川大学、中科院大学、上海交通大学、中国人民解放军海军军医大学、江南大学、中国农业大学、南昌大学、合肥工业大学、天津科技大学、华中农业大学、山东理工大学、北京工商大学、江苏大学、江南大学、大连工业大学、华南理工大学成都中医药大学、北京大学、浙江大学、中南大学、复旦大学、东北大学、国防科技大学、江苏海洋大学、华中科技大学、湖北大学、中国医学科学院、中南大学湘雅医院、中国药科大学、协和药物研究所、中国农业科学院基因组研究所、广州中医药大学、上海中医药大学、上海理工大学、北京中医药大学、武汉大学、香港大学、沈阳药科大学、山东中医药大学、宁波大学、山东大学、甘肃中医药大学、医学院附属仁济医院、中国医学科学院药物研究所、杭州医学院、广州医科大学附属肿瘤医院、中山大学孙逸仙纪念医院、江苏省中医院、中国中医科学院广安门医院、中山大学附属第五医院、中山大学中山眼科中心、汕头大学、扬州大学、天津科技大学、东南大学、上海应用技术大学、中国农业科学院深圳农业基因组研究所 、绍兴文理学院、乔治梅森大学、南京小飞象生物科技有限公司、加州大学、广东省科学院微生物研究所(广东省微生物分析检测中心)、山东绿叶制药有限公司、北京泰德制药股份有限公司、深圳龙昌新药研发有限公司、Osaka University、上海美迪西、防化研究院、国防科技创新研究院、北京安必奇生物科技有限公司、国家纳米科学中心、军事科学院防化研究院、南方科技大学、中国科学院化学研究所、中国农业科学院茶叶研究所、四川国康药业有限公司、南通药明康德医药科技有限公司、南京沛微生物科技有限公司、北京科诺信诚科技有限公司、天士力生物医药股份有限公司、泽达易盛(天津)科技股份有限公司、沈阳市青囊医疗科技有限责任公司、青岛科博源生物技术有限公司、中科聚研(吉林)干细胞科技有限公司、广州同隽医药科技有限公司、北京斯利安药业有限公司、上海韵和生物医药有限公司、北京英飞智药科技有限公司、上海森辉医药有限公司、上海倍勘生物技术有限公司、浙江海正股份有限公司等公司的四百余名工程师老师学生参会,还有许多因为时间冲突没法参加。这次,我们诚挚邀请您来参加!

这篇关于最新科研技术:CADD分子对接、虚拟筛选等/AIDD模型构建和数据分析能力/蛋白晶体结构解析:分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/287984

相关文章

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

Three.js构建一个 3D 商品展示空间完整实战项目

《Three.js构建一个3D商品展示空间完整实战项目》Three.js是一个强大的JavaScript库,专用于在Web浏览器中创建3D图形,:本文主要介绍Three.js构建一个3D商品展... 目录引言项目核心技术1. 项目架构与资源组织2. 多模型切换、交互热点绑定3. 移动端适配与帧率优化4. 可

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

Java Scanner类解析与实战教程

《JavaScanner类解析与实战教程》JavaScanner类(java.util包)是文本输入解析工具,支持基本类型和字符串读取,基于Readable接口与正则分隔符实现,适用于控制台、文件输... 目录一、核心设计与工作原理1.底层依赖2.解析机制A.核心逻辑基于分隔符(delimiter)和模式匹

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

Python利用PySpark和Kafka实现流处理引擎构建指南

《Python利用PySpark和Kafka实现流处理引擎构建指南》本文将深入解剖基于Python的实时处理黄金组合:Kafka(分布式消息队列)与PySpark(分布式计算引擎)的化学反应,并构建一... 目录引言:数据洪流时代的生存法则第一章 Kafka:数据世界的中央神经系统消息引擎核心设计哲学高吞吐