科研动态

Dynamics

首页 >  科研动态 > 新闻  >  详情

《自然》子刊发表实验室最新成果:通过自适应图神经网络预测未知抗体的中和性

近日,上海人工智能实验室与合作伙伴推出了在AI新药研发(AIDD)领域的最新研究成果——通过自适应图神经网络预测未知抗体的中和性。相关论文“Predicting unseen antibodies' neutralizability via adaptive graph neural networks”刊登于国际顶级学术期刊《自然》(Nature)子刊《自然-机器智能》(Nature Machine Intelligence)。论文创新性地提出用于预测抗原-抗体中和性的DeepAAI算法模型,在多种病毒上取得了显著性能。

《自然-机器智能》是在计算机科学、人工智能领域期刊中影响因子最高(25.898)的顶级期刊,关注对该领域具有重要影响的科研成果且评审严格。上海人工智能实验室智慧医疗研究中心成果在该刊发表,为机器学习与抗体治疗领域的研究做出积极贡献,这也是中心继10月份在《柳叶刀》子刊发表论文后,近期又一科研成果登上国际顶刊。

868e630938403d92c0e5bb3f5383d63.png

刊登论文截图

抗体具有调理和中和的作用,是临床治疗病毒感染的强效生物药物,但在进行湿实验之前,抗体对抗原的中和能力却无从知晓。为了解抗体的能力,传统实验包括噬菌体展示、酶联免疫吸附试验(ELISA)、假病毒试验等,需要投入大量的资源和时间。现有方法只能通过从已知的抗原-抗体相互作用中的反向传播误差来学习抗体表征,不适用于缺乏相互作用实例的未知抗体。此外,尽管有用于表示抗原和抗体的各种蛋白质描述符,例如k-mer、PSSM、BlastP等,但它们的特征空间可能是高维的,并且这些特征是预先计算的、静态的、无监督的,在训练过程中没有被优化,对于特定的监督学习任务可能并非最优。

为应对以上问题带来的挑战,研究团队目标开发出准确、快速的计算方法进行初步筛选,以减少湿实验的盲目性并提高湿实验的预见性,加速发现新治疗性抗体的过程。

在该研究中,团队提出了一种基于大规模氨基酸序列的方法,建立DeepAAI的抗原-抗体相互作用预测的深度学习算法模型,专注于预测抗原-抗体中和效应。该模型通过构建两个分别连接抗体和抗原的自适应关系图,并在未知和已知抗体的表征中通过GCN实现拉普拉斯平滑,从而能够从已知抗体中学习未知抗体的表征。

9d9dd72f5676301da8360ef62d448c5.png

研究概览和流程图

DeepAAI应用神经网络将原始特征投影到低维和高表达性的特征空间中,并针对下游任务动态优化,用于预测中和效应以及估计IC50值。该算法模型由AR-GCN模块和CNN模块组成,用于学习抗原/抗体间的全局表征和抗原/抗体内的局部表征。通过在关系图上应用GCN半监督学习预测未知抗体的中和性,即在未知和已知抗体的表征之间应用拉普拉斯平滑进行直推式学习,利用关联的已知的抗体的表征,去学习未知的抗体的表征,并在训练过程中进行优化。同时,通过采用CNN模块来学习抗原-抗体内部的局部特征,以更好地预测抗原-抗体中和作用。

be61b361d21e68f284b5da1d75d5cf7.png

AR-GCN模块通过量化抗体之间和抗原之间的关系,自适应构建两个关系图,并从关系中学习抗原和抗体的表征;CNN模块可从氨基酸序列中提取局部特征。

DeepAAI的性能在多种病毒(包括HIV、SARS-CoV2、流感和登革热)的未知抗体上得到了验证。通过DeepAAI自适应构造的关系图具有丰富的可解释性——抗体关系图可以揭示抗体中和反应的相似性(相似的结合区域),抗原关系图可以揭示病毒不同变体之间的关系。在此基础上,研究人员能够推荐针对病毒新变种的可能的广谱抗体。

e3768a31bae59aee509482531b98e36.png

HIV未知抗体的结果。(a)抗原-抗体配对的数量和抗体的数量。(b)去除相似的抗原-抗体配对(BlastP≥90%)后,在总共27,738个抗原-抗体配对中,抗原-抗体配对两两之间的相似度热图。(c)中和预测任务的性能。(d)IC50预测任务的性能。在(c)和(d)中,在20种不同的随机种子中进行了20次性能评价,箱线图显示中位数、第一、第三、最小和最大四分位数,四分位范围的1.5倍之外的值定义为离群值,最佳模型变种与最佳基准模型之间的比较采用Mann-Whitney U检验(双边)。(e)各个模型每个epoch的运行时间。(f)倒数第二层embedding的PCA结果。(g)预测的中和概率结果的热图。

在新药研发领域,DeepAAI具有重要意义和广泛的应用价值。抗原-抗体相互作用预测的相关方法包括基于序列的方法和基于空间结构的方法,而氨基酸序列在现实世界中很容易获得且数据丰富,相较于后者具有明显优势。因此,由团队提出的这一基于序列的方法,更加便于在实际应用中推广。生物学家可以通过DeepAAI预测抗原-抗体中和/非中和效应作为初步筛选并估算IC50值,以便进行后续的湿实验。此外,DeepAAI还可以结合生成模型对抗体序列进行优化改良,从而提高抗体的活性或从头生成具有活性的抗体序列。

该研究论文共同第一作者为商汤科技杜亿杉和张捷,共同通讯作者为上海人工智能实验室智慧医疗中心主任张少霆、复旦大学医学分子病毒学教育部/卫健委重点实验室陆路和中国科学院深圳先进技术研究院吴红艳。

上海人工智能实验室智慧医疗研究中心旨在通过人工智能与医学的深度交叉融合,基于产业发展的政策推动和行业需求,为医药行业的技术创新与基础研究探索前沿的技术突破与创新思路,科研成果入选 The Lancet Digital Health、Medical Image Analysis、IEEE Transactions on Medical Imaging 等国际顶刊。

如需申请加入课题组研究或了解课题组更多信息,请发邮件至zhangshaoting@pjlab.org.cn,抄送jilu@pjlab.org.cn。

论文链接:https://www.nature.com/articles/s42256-022-00553-w

comm@pjlab.org.cn

上海市徐汇区云锦路701号西岸国际人工智能中心37-38层

沪ICP备2021009351号-1