2023肿瘤医学重磅发布!靶向治疗获得突破性研究进展,这项技术发挥关键作用|世界滚动

2023-05-19 11:31:57 来源: 哔哩哔哩

导语

生物医学是综合医学、生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题。机器学习技术能利用复杂的算法在大规模、异质性数据集中进行运行,在生物医学方面、人类基因组项目、癌症全基因组项目、等项目上都表现出了巨大的潜力,收集并分析与医学疗法和患者预后相关的大量数据集或能将医学转化称为一种数据驱动、以结果为导向的学科,其对于疾病的检测、诊断都有着非常深远的影响。

CADD(Computer Aided Drug Design)的推广应用,经过数十年的积累,已成为当今药物研发不可或缺的一部分,且国内外产出了部分实质性的成果。国外一些大型制药公司如默克、罗氏、诺华等,已经有一些领域通过CADD技术获得了更优的产品,甚至已成功上市,如血管紧张素转化酶抑制剂卡托普利、HIV-1蛋白酶抑制剂沙奎那韦、神经氨酸酶抑制剂扎那米韦等,均用到了一定的CADD来辅助结构优化设计。


【资料图】

AIDD(AIDrug Discovery & Design)范围来说覆盖了机器学习和深度学习,能与新药研发相结合并实质性的应用到靶点预测、高通量筛选、药物设计、药物的ADMET性质预测,等;且算力方面,由早期应用于药物发现领域的决策树、随机向量机等机器学习模型,进展到深度神经网络、卷积神经网络、循环神经网络等深度学习算法。

基因组学(genomics)是对生物体所有基因进行集体表征、定量研究及不同基因组比较研究的一门交叉生物学学科,基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系及对生物体的影响 。机器学习已经被广泛应用于基因组学研究中,利用已知的训练集对数据的类型和应答结果进行预测,深度学习,可以进行预测和降维分析。深度学习模型的能力更强且更灵活,在适当的训练数据下,深度学习可以在较少人工参与的情况下自动学习特征和规律。调控基因组学,变异检测,致病性评分成功应用。深度学习可以提高基因组数据的可解释性,并将基因组数据转化为可操作的临床信息。改善疾病诊断方案,了解应该使用哪些药物和给谁服用药物,最大限度的减少副作用,最大限度的提高疗效,所有这些都要求从基因组原始数据开始进行分析。这将是一项非常耗时的过程,因为涉及到的变量太多了,而深度学习恰恰能帮助缩短这一过程。

单细胞空间转录组(Single-Cell Spatial Transcriptomics) 是一种新兴的基因组学技术,它可以提供细胞组织中细胞的空间分布和基因表达的精确图像。从而更好地理解细胞组织中细胞的功能和表型。它可以提供有关细胞组织中细胞的空间分布和基因表达的更多信息,从而有助于更好地理解细胞组织中细胞的功能和表型。因此,单细胞空间转录组技术可以为研究细胞组织中细胞的功能和表型提供重要的信息。

蛋白质组学是一种研究蛋白质组,也就是细胞或生物体内所有蛋白质的组成、结构和功能的学科。它主要包含蛋白质分离和鉴定、蛋白质互作和代谢、生物信息学分析等方面。蛋白质组学的研究内容非常广泛,它不仅可以帮助我们了解生物体内蛋白质的组成和特性,更可以为生物医学、农业、环保等多个领域的研究提供重要支持。蛋白质的功能一直是生物化学研究的重点。多数蛋白通过与其他蛋白相互作用发挥其生物学功能,参与细胞生命活动。试验方法筛选蛋白质结合配体既耗费人力物力,又由于丰度抑制而很难找到低丰度的配体。一个简洁的途径就是通过机器学习的方法筛选数据库,利用少量的已知相互作用数据,建立了一个整合的预测系统,预测蛋白质相互作用,然后再用生物学试验进行验证。这样能将有限的试验资源导向最有可能的潜在配体。

CADD计算机辅助药物设计课表目录

向下滑动查看完整内容

第一节课

背景与理论知识以及工具准备

1.   生物分子相互作用基础

1.1生物分子相互作用研究方法

1.2蛋白-小分子,蛋白-蛋白相互作用原理

1.2分子对接研究生物分子相互作用

1.3蛋白蛋白对接研究分子相互作用

2.PDB及PDBsum数据库的介绍和使用

1.1数据库简介(功能,可获取资源,重要性)

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.4靶点蛋白背景分析

1.5批量下载蛋白晶体结构

3.Pymol软件的介绍与使用

3.1软件安装及基本知识介绍

3.2蛋白小分子相互作用图解

3.3 蛋白蛋白相互作用图解

3.4蛋白-配体小分子表面图、静电势表示

3.5蛋白-配体结构叠加与比对

3.6绘制相互作用力

3.7 pymol动画制作

3.8 实例讲解与练习

4.notepad++的介绍和使用

第二节课

小分子化合物库及蛋白-配体对接讲解

1.ChemDraw软件介绍

1.1小分子结构构建

1.2 小分子理化性质计算

1.3实例讲解

2.   小分子数据库

2.1 Zinc,ChEMBL,DrugBank等数据库介绍及使用

2.2 其它常用数据库介绍及使用

3.   分子对接基础

3.1分子对接的原理及软件介绍

3.2分子对接软件(Autodock/Autodock vina)使用

3.3半柔性对接

3.3.1小分子配体优化准备

3.3.2 蛋白受体优化及坐标文件准备

3.3.3 半柔性对接计算

3.2对接结果评价

3.2.1晶体结构构象对比

3.2.2能量角度评价对接结果

3.2.3聚类分析评价对接结果

3.2.4最优结果选择

4 柔性对接

4.1 半柔性对接与柔性对接的比较

实例讲解与练习

第三节课

虚拟筛选

1.   openbabel的介绍和使用

1.1 openbabel软件介绍

1.2 小分子结构类型

1.3 小分子结构类型转换

2.   分子对接用于虚拟筛选

2.1 虚拟筛选定义、流程

2.2 靶蛋白选取,化合物库获取

2.3 虚拟筛选

2.4 结果分析

虚拟筛选的流程及实战演示

3.药物ADME预测

3.1ADME概念介绍

3.2预测相关网站及软件介绍

3.3预测结果的分析

第四节

拓展对接的使用方法

1.蛋白-蛋白大分子对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3受体和配体蛋白前期优化准备

1.4蛋白蛋白相互作用对接位点设定

1.5蛋白蛋白对接结果分析与解读

实例讲解与练习

2.蛋白-多肽对接

2.1 蛋白-多肽相互作用简介

2.2 蛋白-多肽分子预处理

2.3 蛋白-多肽分子对接

2.4 对接结果展示与分析

实例讲解与练习

3.含金属离子的蛋白靶点与小分子对接

3.1 金属酶蛋白-配体的相互作用介绍

3.2 相关蛋白及配体分子的收集与预处理

3.3 金属离子的处理与准备

3.4 金属辅酶蛋白-配体的对接

3.5 对接结果展示与分析

实例讲解与练习

4.核酸-小分子对接

4.1 核酸-小分子的应用场景

4.2 核酸-小分子相互作用简介

4.3 核酸-小分子的预处理

4.4 核酸-小分子对接

4.5 相关结果的展示与分析

实例讲解与练习

5.共价对接

5.1共价对接的原理及应用场景

5.2 蛋白和共价结合配体的预处理

5.3 药物分子与靶蛋白的共价对接

5.4 相关结果的展示与分析

实例讲解与练习

第五节

药效团模型及基于碎片的药物设计

1.   药效团模型的构建与使用

1.1药效团模型介绍

1.2药效团模型的构建

1.3药效团模型用于虚拟筛选

实例讲解与练习

2. 基于碎片药物设计

2.1基于碎片的药物设计与发现

2.2 基于碎片化合物库构建

2.2.1 骨架替换

2.2.2 碎片连接

2.2.3 碎片生长

2.3 基于药效团的化合物库生成

2.4 基于蛋白结合口袋的化合物库生成

2.5 基于分子描述符的化合物库生成

2.6 基于BREED规则的化合物库构建(生成小配体碎片库)

2.7 基于碎片的化合物库筛选

实例讲解与练习

3.QSAR模型介绍及构建

3.1 QSAR模型介绍

3.2 QSAR模型创建

3.3 QSAR模型分析

3.4 QSAR模型指导药物设计

实例讲解与练习

第六节

分子动力学模拟

1.Linux入门

1.1 Linux常用命令

1.2 Linux环境变量

1.3 Linux上的操作体验(分子对接)

2. 分子动力学模拟介绍

2.1分子动力学简介

2.1.1 分子力学的基本假设

2.2.2 分子力学的主要形式

2.2分子力场的介绍与应用

3 分子动力学软件介绍及使用

3.1 分子动力学软件(Gromacs)介绍

3.2 Gromacs 进行分子动力学模拟

3.2.1 配体分子及蛋白结构的处理

3.2.2 蛋白坐标文件的修改

3.2.3 拓扑文件修改

3.2.4 构建盒子并放入溶剂

3.2.5 平衡系统电荷

3.2.6 能量最小化

3.2.7 NVT及NPT平衡

3.2.8 模拟结果取样

3.3 分子动力学模拟结果分析

实例讲解与练习

案例图片

AIDD人工智能药物发现与设计课表目录

向下滑动查看完整内容

第一天

AI+制药

1、计算机辅助药物设计(CADD)简介

2、人工智能药物发现(AIDD)简介

3、AI+制药行业简介

4、常见AI制药工具简介(1)Anaconda(2)Rdkit(3)Temsorflow(4)Pytorch(5)Deepchem

5、python基础编程与进阶

6、基于结构的药物发现与设计

7、分子对接与分子动力学简介

8、基于配体的药物发现与设计

9、基于机器学习与深度学习的药物发现于设计

10、分子生成与药物设计

11、ChatGPT与药物发现

数据采集

1、 网络开源数据库:(1)ChemBL(2)BindingDB(3)PubChem(4)ZINC(5)PDB(6)中药数据库

2、 网络爬虫

3、 实验数据

4、 问卷数据

数据处理

1、pandas

2、numpy

特征工程

1、rdkit

2、drugtax

3、在线的计算分子描述符的网站

4、利用自己的想法构建新颖的描述符

第二天

机器学习模型

1、机器学习模型构建与评估

2、线性模型

3、逻辑回归

4、朴素贝叶斯

5、kNN

6、支持向量机(SVM)

7、决策树

8、随机森林

9、极端随机树

10、XGboost

11、LightGBM

12、机器学习模型案例分析:预测化合物生物活性与毒性

无监督学习

相关分析(corr)、主成分分析(PCA)、聚类分析(Cluster)等

第三天

统计线性模型

1、线性模型

2、最小二乘回归

3、多元线性回归

4、岭回归

5、lasso最小角回顾

6、主成分回归

7、偏最小二乘回归

8、混合线性模型

9、回归模型案理分析:基于化合物

10、活性数据建立定量构效关系回归模型

第四天

深度学习模型

1、人工神经网络ANN(MLP)

2、卷积神经网络(CNN)

3、全卷积神经网络(FCN)

4、图神经网络(GNN)

5、图卷积神经网络(GCN)

6、生成式对抗网络(GAN)

7、图注意力模型(GAT)

8、基于人工神经网络图神经网络建立化合物活性预测模型

第五天

分子生成模型

1、循环神经网络(RNN)

2、长短期记忆网络(LSTM)

3、基于生ZINC数据库或chembl数据库建立分子生成模型

4、基于ChatGPT/ChatMol生成化合物结构

AIDD与药物设计的一些思路分享

从药物分子配体的角度

构建机器学习分类或回归模型

1、逻辑回归

2、朴素贝叶斯

3、kNN

4、支持向量机(SVM)

5、决策树

6、随机森林

7、极端随机树

8、XGboost

9、LightGBM

从药物靶点角度

1、药效团;(1)基于配体的药效团;(2)基于蛋白结构的药效团;(3)基于蛋白配体复合物药效团。

2、分子对接:(1)Schrodinger: Glide分子对接(自由能微扰、内置的AIDD的方法);(2)AutoDock vina分子对接;(3)Discovery Studio分子对接(贝叶斯机器学习方法、支持向量机方法);(4)MOE分子对接(分子指纹图谱、内置的AIDD的方法)。

3、分子动力学:(1)蛋白和配体复合物的分子动力学,看RMSD、自由能、RMSF等指标来解释问题;(2)纯蛋白在溶液环境中(FTmap、在线的深度学习方法预测活性口袋);(3)小分子在溶液环境中;(4)糖类化合物;(5)蛋白蛋白相互作用(PD-1-PD-L1、PD-1-单抗);(6)研究靶点蛋白中水分子、金属离子、氢键对小分子活性的重要性;(7)研究靶点蛋白点突变对化合物活性的影响(经典的实例就是KRAS靶点,如安进的AMG510);(8)研究小分子官能团对靶点活性的影响。

从药物靶点和配体复合结构角度

1、分子对接结合神经网络模型,增强对接的准确性,(1)Vina+CNN;(2)GNN。

2、反向对接的思想,利用现有小分子来探索对应的靶点:已知化合物的活性,然后研究对哪些靶点是有活性的,X=提取的特征,y是对哪些靶点有活性。

3、网络药理学,图神经网络,需要找到多个靶点与多个小分子配体之间的关系:底物和蛋白酶的关系

4、研究变量是什么:(1)是否是某个靶点的底物(2)中药对心脏/肝脏/肾脏的是否有毒性(3)中药对疾病如肿瘤是否有一定的疗效

5、影响因素->特征提取:(1)药物理化性质,如Rdkit、drugtax提取理化性质特征(2)药物实验的数据(3)分子对接得分

6、主成分分析

7、GNN: 药物和靶点/疾病作为节点(Node),治疗关系作为边(Edge), 这样来构建图神经网络。

数据库思想

1、构建碎片库

2、对现有感兴趣的片段结合生成新的分子

3、构建靶点突变的数据库

4、用分子生成的方法生成数据库

药物发现

1、高通量筛选

2、虚拟筛选

3、结构优化

4、药效评价

药物设计

1、基于靶点的设计

2、基于配体的设计

3、基于药效团的设计

4、基于分子动力学的设计

5、基于人工智能的设计

案例图片

深度学习在基因组学应用课表目录

向下滑动查看完整内容

第一节

理论部分

深度学习算法介绍

1.有监督学习的神经网络算法

1.1全连接深度神经网络DNN在基因组学中的应用举例

1.2卷积神经网络CNN在基因组学中的应用举例

1.3循环神经网络RNN在基因组学中的应用举例

1.4图卷积神经网络GCN在基因组学中的应用举例

2.无监督的神经网络算法

2.1自动编码器AE在基因组学中的应用举例

2.2生成对抗网络GAN在基因组学中的应用举例

实操内容

1.Linux操作系统

1.1常用的Linux命令

1.2 Vim编辑器

1.3基因组数据文件管理,修改文件权限

1.4查看探索基因组区域

2.Python语言基础

2.1.Python包安装和环境搭建

2.2.常见的数据结构和数据类型

第二节课

理论部分

基因组学基础

1.  基因组数据库

2.  表观基因组

3.  转录基因组

4.  蛋白质组

5.  功能基因组

实操内容

基因组常用深度学习框架

1.  安装并介绍深度学习工具包tensorflow, keras,pytorch

2.  在工具包中识别深度学习模型要素

2.1.数据表示

2.2.张量运算

2.3.神经网络中的“层”

2.4.由层构成的模型

2.5.损失函数与优化器

2.6.数据集分割

2.7.过拟合与欠拟合

3.基因组数据处理

3.1安装并使用keras_dna处理各种基因序列数据如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WIG等

3.2使用keras_dna设计深度学习模型

3.3使用keras_dna分割训练集、测试集

3.4使用keras_dna选取特定染色体的基因序列等

第三节

理论部分

卷积神经网络CNN在基因调控预测中的应用

1.   Chip-Seq中识别基序特征G4,如DeepG4

2.   Chip-Seq中预测DNA甲基化,DeepSEA

3.   Chip-Seq中预测转录调控因子结合,DeepSEA

实操内容

复现卷积神经网络CNN识别基序特征DeepG4、非编码基因突变DeepSEA,

1.   复现DeepG4从Chip-Seq中识别G4特征

2.   安装selene_sdk,复现DeepSEA从Chip-Seq中预测DNA甲基化,非编码基因突变

第四节

深度学习在识别拷贝数变异DeepCNV、预测premiRNA上的应用

1.   SNP微阵列中预测拷贝数变异CNV,DeepCNV

2.   RNA-Seq中预测premiRNA,dnnMiRPre

实操内容

1.   复现DeepCNV利用SNP微阵列联合图像分析识别拷贝数变异

2.   复现循环神经网络RNN工具 dnnMiRPre,从RNA-Seq中预测premiRNA

第五节

理论部分

深度学习在识别及疾病表型及生物标志物上的应用

1.   从基因表达数据中识别乳腺癌分型的深度学习工具DeepType

实操内容

1.       复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型

第六节

理论部分

深度学习在预测药物反应机制上的应用

2.   联合肿瘤基因标记及药物分子结构预测药物反应机制的深度学习工具SWnet

实操内容

3.   预处理药物分子结构信息

4.   计算药物相似性

5.   在不同数据集上构建self-attention SWnet

6.   评估self-attention SWnet

7.   构建多任务的SWnet

8.   构建单层SWnet

9.   构建带权值层的SWnet

案例图片

机器学习单细胞分析应用课表目录

向下滑动查看完整内容

第一天

理论部分

1.多组学基础

2.常用生物组学实验与分析方法

3.常用组学数据库介绍

4.批量处理组学数据

5.生物功能分析

实操内容

1.R语言基础

2.R和Rstudio的安装

3.R包安装和环境搭建

4.数据结构和数据类型

5.R语言基本函数

6.数据下载

7.数据读入与输出

第二天

理论部分

1.机器学习概述

2.线性模型

3.决策树

4.支持向量机

5.随机森林

实操内容

1.决策树算法实现

2.随机森林算法实现

3.支持向量机(SVM)算法实现

4.朴素贝叶斯算法实现

5.Xgboost算法实现

6.主成分分析PCA算法实现

7.聚类算法实现

第三天

理论部分

1.机器学习模型选择与性能优化

2.多组学数据机器学习的前景

3.临床数据与机器学习的融合

实操内容

1.Python语言基础

2.python安装与开发环境的搭建

3.基本数据类型组合数据类型

4.分析环境搭建

5.Workshop——多组学机器学习实例

第四天

理论部分

1.单细胞测序原理

2.单细胞测序平台

3.单细胞测序方法及数据

4.单细胞数据分析流程

5.基于转录组学的差异基因筛选,疾病预测

6.基于差异基因联合多组学分析疾病发生机制

7.组学数据可视化

实操内容

1.创建Seurat对象

2.数据质控

3.测序深度差异及标准化

4.单细胞数据降维

5.批次效应去除

6.数据整合

7.亚群注释

第五天

理论部分

1.机器学习在单细胞分析中的应用

2.收集数据

3.数据准备

4.选择一个模型

5.模型训练

6.模型评估

7.参数调整

8.模型预测

实操内容

1.创建Seurat对象

2.数据质控

3.测序深度差异及标准化

4.单细胞数据降维

5.批次效应去除

6.数据整合

7.亚群注释

8.GSVA通路活性分析

9.单细胞富集分析

第六天

理论部分

1.深度学习在单细胞分析中的应用与前景

2.非负矩阵分解原理

3.生成网络原理

4.生成网络在多组学中的应用

实操内容

1.非负矩阵分解

2.单细胞数据降维、聚类

3.单细胞数据注释

4.比较NMF与PCA的差异

5.深度学习生成模型与公共数据库联合分析

6.生成模型与多模态数据的应用

案例图片

单细胞空间转录组分析课表目录

向下滑动查看完整内容

第一天

单细胞测序技术与应用

理论内容:

1.单细胞组学研究简介

2.单细胞转录组测序技术进展及其原理:1992\2009-至今

3.单细胞多组学和空间转录组技术;

4.单细胞转录组测序技术的常见应用和重要生物学发现;

5.单细胞重大项目及数据库介绍。

实操内容:

1. Linux 命令入门讲解及实操训练。

2. R 语言简介及安装。

3. R 语言简单语法及常见命令。

4. 数据挖掘及其统计应用。

5. R 语言实操画图 ggplot2 为主。

第二天

单细胞转录组数据分析思路及 流程以及数据分析实操

理论内容:

1. 单细胞实验介绍,常见建库结构。

2. 单细胞转录组 Pipeline 软件和代码介绍。

3. 单细胞转录组转录因子及其细胞通讯介绍。

4. 单细胞组学在肿瘤、发育、免疫及其它等领域的研究思路。

实操内容:

1. 10X 官方单细胞软件 Cellranger 讲解及实操。

2.质控基因和细胞。

3.选取高可变基因。

4.降维与分群。

5.Biomarker 定义细胞类型。

6.寻找差异基因

7. 通过 Seurat 合并多样本及消除样本异质性。

第三天

单细胞转录组轨迹、通路、转录因子等分析及绘图实操

实操内容:

1. 通过 Monocle 软件对单细胞转录组进行拟时序的分析。

2. 对单细胞各个簇进行通路的功能富集分析。

3. 通过 GSVA 给细胞通路打分等。

4. 细胞互作进行分析。

5.全面解析 SCENIC 软件进行转录因子预测分析。

理论内容:

1. 空间转录组技术的介绍。

2. 空间转录组技术的应用。

3. 空间转录组文章图表的解读。

4. 空间转录组技术在癌症、发育、神经科学等领域的研究思路。

第四天

空间转录组数据比对、降维以 及聚类等分析 空间转录组多样本及与单细胞数据关联分析

实操内容:

1. 10x Visium 组织优化及文库制备。

2. 10x Visium 官方分析软件 Space Ranger 讲解及实操。

3. Space Ranger 输出结果解读。

4. Loupe Browser 软件安装及使用。

5. 通过 Seurat 软件进行降维、聚类和可视化。

6. 通过 Seurat 进行基因表达可视化。

理论+实操内容

1. 通过 Seurat 进行空间变量特征的识别。

2. 与单细胞数据关联分析(空间细胞类型定义)

3. 通过 Seurat 处理多个切片。

4. 单细胞及空间转录组数据分析总结

第五天

联合使用Bulk、singlecell RNAseq、SpatialRNAseq数据进行分析。

实操内容:

1. 寻找特定疾病或肿瘤公共数据库

2. 获得Bulk数据、scRNAseq数据

3. 获取转录组参考数据

4. 使用深度学习生成网络得到多模态数据

5. 通过 R对多模态进行联合分析

6. 分析结果可视化。

理论+实操内容

1. 了解常用疾病数据库。

2. 深度学习基本知识

3. 深度学习生成网络

4. 多模态数据的联合方法

案例图片

机器学习在蛋白质组学实践应用课表目录

向下滑动查看完整内容

第一天

机器学习及蛋白组学简介

1.机器学习基本概念介绍

2.常用机器学习模型介绍

3.混淆矩阵

4.ROC曲线

5.主成分分析(PCA)

6.蛋白组学基本概念.

R语言简介及实操

1.R语言概述

2.R软件及R包安装

3.R语言语法及数据类型

4.条件语句

5.循环

6.函数

7.常用的机器学习相关R包介绍

第二天

机器学习在蛋白组学数据分析中的应用案例分享:

1.利用机器学习鉴定疾病相关蛋白标志物

2.利用机器学习基于蛋白组学数据预测表型

3.利用机器学习基于蛋白组学数据进行分类

4.利用机器学习基于蛋白组学数据构建预后模型.

蛋白组学相关数据库介绍:

1.Uniport 2.HPA 3.TCPA 4.CPTAC.

第三天

利用PLOS Computational Biology(IF:5分)发表零

代码工具,轻松完成差异表达分析,常见统计分析,常

见可视化,

内置7种机器学习方法,轻松调用:

1.数据导入(两套数据,二分类,多分类)

2.数据可视化(散点图,热图,柱形图,相关性热图,

火山图,层次聚类图)

3.缺失值填充

4.数据归一化

5.离群值检测/清理

6.常见统计方法应用(t-test, limma, Kruskal-Wallis ,

ANOVA, PCA, k-means, 相关性分析)

7.机器学习方法应用(RF, lasso, SVM等).

第四天

利用机器学习基于蛋白组学数据预测表型,基于蛋白组

学数据复现cell中机器学习分析结果

实操内容:

1.蛋白组学数据处理,差异表达分析

2.火山图,多分组热图,多组箱型图展示差异表达分析

结果

3.构建Random Forest模型

4.重要蛋白筛选

5.绘制ROC曲线

6.独立测试集检测模型表现

利用机器学习鉴定疾病相关蛋白标志物,基于Olink数

据,复现影响因子17分文章中,蛋白数据常规分析+时

序蛋白聚

类分析+机器学习分析结果

实操内容:

1.读取蛋白表达数据

2.差异蛋白挑选,火山图绘制,箱型图绘制

3.时序蛋白表达数据聚类分析

4.构建随机森林模型

5.挑选重要特征

6.独立测试集进行验证.

第五天

利用机器学习基于质谱的蛋白质组学数据,构建肝病

相关分类和预后模型,复现Nature Medicine文章

中的机器学习,生存分析,预后模型相关的结果

实操内容:

1.鉴定与不同肝病显著相关的蛋白

2.比较22种不同的机器学习分类器,挑选最优算法构

建不同肝病的分类模型

3.独立队列验证模型准确性

4.构建预后模型

5.绘制生存曲线和时间依赖的ROC曲线.

教 学 团 队

主讲老师,2018年~2020在中科院化学所工作,工程师岗,主要做一些分子合成类工作,擅长解析核磁光谱,对有机小分子结构有一定敏感度。2021~至今在医药公司(AI药物研发部)做药物研发工程师,主要从事CADD(分子对接做的较多)及AIDD(分子生成模型相关工作)相关的工作。参与过的项目:参与研发的项目中,小分子药物居多,也有siRNA递送系统相关的及一个短肽相关的药物研发项目。对于小分子药物的对接,做过激酶收体及膜蛋白受体。对AIDD及CADD的整套流程都能有所把握。主讲老师在我单位长期进行授课,讲课内容和授课方式,以及敬业精神受到参会学员的一致认可和高度评价。刘老师,副教授,生物信息学博士,有十余年的测序数据分析经验。研究领域涉及人工智能、自然语言处理、功能基因组学、转录组学、miRNA及靶基因网络分析,单细胞测序数据分析,基因调控网络时序分析,蛋白质互作网络分析,多组学联合分析等。主持省自然科学基金等项目4项,出版医学实用教材《Python医学实战分析》,发表SCI论文23篇,其中一作及并列一作9篇。鹤老师,临床医学博士,主要研究领域单细胞多组学解析肿瘤微环境、机器学习算法在临床医学中的应用。具有计算生物学、生物信息学、临床医学交叉背景。致力于解析恶性肿瘤微环境异质性和机制,具有多年生物信息分析经验,擅长单细胞多组学整合分析。以第一作者、通讯作者发表SCI期刊十余篇,有丰富的生物信息学审稿经验。擅长生物信息学与临床资源结合,应用机器学习、深度学习方法解决临床问题。李老师,微生物学博士,研究方向:生物信息学、数据挖掘、机器学习、深度学习。曾从事基因组学、蛋白质组学、生物信息学和药物组学等领域的研究。利用计算机、统计学、数学 等学科来解决生物学问题。主要针对人类各种癌症的发病机制进行研究,包括肝癌、肺癌、直肠癌等。提出了最小生成树算法来研究与肺癌相关子通路(Sub_SPIA)、基于皮尔森相关系数变化的信号通路分 析方法(SPIA_PCC)、基于 miRNA 与 mRNA 表达数据的 miRNA 识别方法(MIMRDA)以及基于信号通路 网络的直肠癌相关药物重定位(SPNDDA)。参与国家自然科学基金项目、浙江省杰出青年科学基金项目 研究、国家科技重大专项计划以及国家自然科学基金委员会超级计算重大专项。先后在 Frontiers in Genetics、PLoS ONE、IET System Biology、Computational biology and chemistry 等国际期刊 发表 SCI 论文 5 篇

授课方式及福利

1、通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,课后学习完毕提供全程录像视频回放。

2、开课前一周会提前发送给学员教程资料及预习视频,所有培训使用软件都会发送给学员。    

3、培训完毕后老师长期解疑,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,微信解疑群永不解散,往期培训学员对于培训质量和授课方式一致评价极高。

报名费用及优惠

课 程原 价早鸟价CADD计算机辅助药物设计实践应用专题58805380AIDD人工智能药物发现实践应用专题 58805380深度学习在基因组学实践应用专题58805380机器学习单细胞分析实践应用专题 58805380单细胞空间转录组实践应用专题46804180机器学习在蛋白质组学实践应用专题46804180

优惠:

优惠1:前20名报名并缴费学员+转发到朋友圈或者到学术交流群可享受每人350元优惠。

优惠2:一人同时报两课及以上的,每课再享优惠500元。

优惠3:一人同时报名两课,免费赠送一个学习名额(赠送课程任选)

优惠4:一人同时报名四课,免费赠送两个学习名额(赠送课程任选)

授课时间

CADD计算机辅助药物设计专题培训课时间安排

2023.6.23-6.24

(全天授课)

上午 09:00-12:00下午 13:30-17:302023.6.27-6.30 (晚上授课)晚上 20:00-22:302023.7.1-7.2(全天授课)上午 09:00-12:00下午 13:30-17:30

AIDD人工智能药物发现与设计专题培训课时间安排

2023.6.24

(全天授课)

上午 09:00-11:30下午 13:30-17:002023.6.25-6.26(晚上授课)晚上 19:00-22:002023.6.29-6.30(晚上授课)晚上 19:00-22:002023.7.1-7.2(全天授课)上午 09:00-11:30下午 13:30-17:00

深度学习在基因组学中的应用课培训课时间安排

2023.6.23-6.24

(全天授课)

上午 09:00-11:30下午 13:30-17:002023.6.27-6.30 (晚上授课)晚上 19:00-22:002023.7.1-7.2(全天授课)上午 09:00-11:30下午 13:30-17:00

机器学习单细胞分析应用专题培训课时间安排

2023.6.26(晚上授课)

晚上 19:00-22:002023.6.28 (晚上授课)晚上 19:00-22:002023.7.2(全天授课)上午 09:00-11:30下午 14:00-17:002023.7.4 (晚上授课)晚上 19:00-22:002023.7.6 (晚上授课)晚上 19:00-22:002023.7.8(全天授课)上午 09:00-11:30下午 14:00-17:002023.7.10-7.13(晚上授课)晚上 19:00-22:00

单细胞空间转录组培训课时间安排

2023.6.27(晚上授课)

晚上 19:00-22:002023.6.29 (晚上授课)晚上 19:00-22:002023.7.1(全天授课)上午 09:00-11:30下午 14:00-17:002023.7.3 (晚上授课)晚上 19:00-22:002023.7.5 (晚上授课)晚上 19:00-22:002023.7.7(晚上授课)晚上19:00-22:002023.7.9(全天授课)上午 09:00-11:30下午 14:00-17:00

机器学习蛋白质组学培训课时间安排

2023.6.23-6.24

(全天授课)

上午 09:00-11:30下午 14:00-17:002023.6.25-6.30 (晚上授课)晚上 19:00-22:30

往期参会学员单位

有来自中科院大学、上海交通大学、中国人民解放军海军军医大学、江南大学、中国农业大学、南昌大学、合肥工业大学、天津科技大学、华中农业大学、山东大学、加州伯克利大学、启元实验室、中国人民解放军总医院第一医学中心、河南师范大学、南京工业大学、南方科技大 学、南京大学、中国医学科学院基础医学研究所、青海省农林科学院、天津中医药大学第一附属医院、山东大学、黑龙江八一农垦大学、南昌大学第二附属医院、台州市中心医院(台州学院附属医院)、宁波大 学附属人民医院、新疆农业大学、北京林业大学、广西医科大学、湖南文理学院、滨州医学院、滨州医学 院烟台附属医院、华南师范大学、中国环境科学研究院、云南师范大学、昆明理工大学、湖北医药学院、 苏州大学、福州大学、南方医院、南昌大学第二附属医院、深圳市中医院、湖南文理学院、河南科技学 院、福建省立医院、中南大学湘雅医院、深圳市中医院、省立同德医院、内蒙古科技大学包头师范学院、 乌鲁木齐市疾病预防控制中心、中国林业科学研究院林业研究所、中国农业科学院兰州畜牧与兽药研究 所、鲁东大学、河北工程大学、南方医科大学珠江医院、首都医科大学附属北京妇产医院、重庆医科大学 附属第二医院、北京普利智诚生物技术有限公司、复旦大学上海医学院、陕西中医药大学附属医院、中国 医学科学院血液病医院(中国医学科学院血液学研究所)、滨州康达欣医疗器械有限公司、深圳北京大学 香港科技大学医学中心、天津市肿瘤医院、陆军特色医学中心、空军军医大学第一附属医院、江南大学。感谢对我们培训的认可!还有许多因为时 间冲突无法参加。这次我们诚挚邀请您来参加!

关键词:

精选 导读

天天时讯:科技赋能全场景,兴业通代发上线

近日,兴业数金自主研发的一体化代发平台“兴业通代发”成功上线,系统具有轻量、独立的优点,可为企业提供专

发布时间: 2023-05-19 11:17
要闻   2023-05-19

全球微速讯:商务部:1-4月我国企业承接服务外包合同额6831

5月19日,商务部数据显示,1-4月,我国企业承接服务外包合同额6831亿元人民币,执行额4612亿元,同比分别增

发布时间: 2023-05-19 10:38
要闻   2023-05-19

【天天热闻】青海省市场监督管理局关于检出5批次不符合食品

青海省市场监管局在近期组织开展的食品安全监督抽检中,检出5批次不符合食品安全标准的食品。

发布时间: 2023-05-19 10:12
要闻   2023-05-19

福特因后视摄像头故障召回42.2万辆SUV|世界关注

福特因后视摄像头故障召回42 2万辆SUV本次召回的范围包括带有360度环影功能的2020至2023款福特探险者、林肯

发布时间: 2023-05-19 09:57
要闻   2023-05-19

谷歌被控肆意追踪用户位置信息:花费3990万美元达成和解 每

App5月19日消息,谷歌在地理位置追踪政策方面误导消费者,美国华盛顿州将谷歌告上法庭,现在谷歌决定以3990

发布时间: 2023-05-19 09:05
要闻   2023-05-19

热点 推荐

2023肿瘤医学重磅发布!靶向治疗获得突破性研究进展,这项技

导语生物医学是综合医学、生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及

发布时间: 2023-05-19 11:31
科技   2023-05-19

天天时讯:科技赋能全场景,兴业通代发上线

近日,兴业数金自主研发的一体化代发平台“兴业通代发”成功上线,系统具有轻量、独立的优点,可为企业提供专

发布时间: 2023-05-19 11:17
要闻   2023-05-19

创益通:5月18日融资买入324.07万元,融资融券余额5775.75万

5月18日,创益通(300991)融资买入324 07万元,融资偿还345 77万元,融资净卖出21 7万元,融资余额5775 75万元。

发布时间: 2023-05-19 10:48
IT   2023-05-19

英伟达今年“翻倍”、C3.ai单周暴涨35%,美股AI龙头“杀疯了”

人工智能AI掀起了市场的新热潮,争相入局AI的企业迎来了股价的暴涨。今年以来,受益于生成式人工智能AI的火

发布时间: 2023-05-19 10:47
国内   2023-05-19

5月19日国内邻二甲苯企业报价暂稳

产品名称地区厂家价格邻二甲苯中石化华东扬子石化8100元 吨邻二甲苯中石化华北齐鲁石化8100元 吨邻二甲苯中

发布时间: 2023-05-19 10:51
科技   2023-05-19

全球微速讯:商务部:1-4月我国企业承接服务外包合同额6831

5月19日,商务部数据显示,1-4月,我国企业承接服务外包合同额6831亿元人民币,执行额4612亿元,同比分别增

发布时间: 2023-05-19 10:38
要闻   2023-05-19

苍穹巨灵·盐城篇-世界热文

湿地是野生动植物的重要栖息地全球超过40%的物种都依赖湿地繁衍生息江苏省盐城市位于我国黄海之滨拥有我国

发布时间: 2023-05-19 10:34
IT   2023-05-19

天天热文:《变形金刚7》新预告和海报:这一战关乎地球命运

《变形金刚7》发布最新预告与海报。快一起来欣赏一下吧。

发布时间: 2023-05-19 10:30
国内   2023-05-19

全球百事通!2023曲阜汽车消费券商家名单(曲阜汽车店)

在曲阜市商务局指定汽车零售企业购买家庭乘用车且在济宁市上牌可以参与领汽车消费券,领券后在曲阜市家庭乘

发布时间: 2023-05-19 10:23
科技   2023-05-19

【天天热闻】青海省市场监督管理局关于检出5批次不符合食品

青海省市场监管局在近期组织开展的食品安全监督抽检中,检出5批次不符合食品安全标准的食品。

发布时间: 2023-05-19 10:12
要闻   2023-05-19

每日快看:售52.18万元 奥迪S4 Avant正式上市

[本站新车上市]2023年5月19日,奥迪S4Avant正式于中国市场上市,市场指导价52 18万元。作为奥迪S家族的又一

发布时间: 2023-05-19 10:20
汽车   2023-05-19

全球新消息丨小米note3怎么连接电脑传文件 小米note3怎么连

今天来聊聊关于小米note3怎么连接电脑传文件,小米note3怎么连接电脑的文章,现在就为大家来简单介绍下小米note3

发布时间: 2023-05-19 10:04
IT   2023-05-19

手机yy怎么修改密码_手机yy怎么改名字|焦点精选

你们好,最近小未来发现有诸多的小伙伴们对于手机yy怎么修改密码,手机yy怎么改名字这个问题都颇为感兴趣的

发布时间: 2023-05-19 09:58
国内   2023-05-19

菜鸟CEO万霖发布全员信:启动IPO计划 建设全球领先的数智物

阿里巴巴5月18日晚宣布菜鸟将启动探索上市,预计在未来12至18个月内完成。

发布时间: 2023-05-19 10:01
科技   2023-05-19

福特因后视摄像头故障召回42.2万辆SUV|世界关注

福特因后视摄像头故障召回42 2万辆SUV本次召回的范围包括带有360度环影功能的2020至2023款福特探险者、林肯

发布时间: 2023-05-19 09:57
要闻   2023-05-19

前沿热点:车主对奔腾T99评价如何?买车之前这些你要知道

当今汽车市场的竞争愈发激烈,在SUV领域尤为突出,尤其是在15-20万价位的SUV。今天为大家推荐的是奔腾T99,

发布时间: 2023-05-19 09:47
国内   2023-05-19

豪华如何定义?沃尔沃钦培吉就品牌定位展开回答_环球百事通

众所周知,智能电动车时代无疑面临着很多问题,首先就是同质化。特别是当价格战越卷越厉害,新势力在配置上

发布时间: 2023-05-19 09:35
IT   2023-05-19

全国已组建家庭医生团队超42万个

“居民健康的守门人”!全国已组建家庭医生团队超42万个rDA中国藏族网通今天(19日)是第13个“世界家庭医

发布时间: 2023-05-19 09:42
科技   2023-05-19

谷歌被控肆意追踪用户位置信息:花费3990万美元达成和解 每

App5月19日消息,谷歌在地理位置追踪政策方面误导消费者,美国华盛顿州将谷歌告上法庭,现在谷歌决定以3990

发布时间: 2023-05-19 09:05
要闻   2023-05-19

绿地控股2025年9月到期美元债势创最大涨幅至23.6美分 环球热文

5月19日消息,绿地控股2025年9月到期美元债势创1月6日以来最大涨幅,截至北京时间7时5分,该公司6 75%债券

发布时间: 2023-05-19 08:59
国内   2023-05-19