图1. OPUS-Mut算法流程图
蛋白质侧链结构是蛋白质之间相互作用的基础,而蛋白质之间的相互作用又是多肽药物开发的关键。在蛋白质之间发生相互作用时,其位于接触面的残基的侧链结构起到了关键作用,发生了相应的构象变化。因此,精准地对接触面残基进行侧链建模是研究蛋白质之间相互作用的关键。
在对蛋白质多聚体的侧链建模中,尤其对位于接触面的氨基酸侧链建模中,OPUS-Mut展现了比其它侧链建模算法更高的准确率(图2、图3)。在蛋白质接触面上,预测更为准确的氨基酸侧链构象对研究蛋白质相互作用问题提供了帮助。
图2. 不同侧链建模算法在三个蛋白质多聚体测试集中的侧链建模性能。a)在全部氨基酸上的侧链建模准确率;b)在接触面氨基酸上的侧链建模准确率。
图3. OPUS-Mut侧链建模结果。绿色和黄色为多聚体中两条不同蛋白的天然构象,红色为OPUS-Mut的预测侧链结构。
在评价蛋白质对接构象时,预测更为准确的侧链构象是提升那些基于侧链位置信息的打分函数准确性的关键。值得注意的是,OPUS-Mut在预测残基侧链的同时,还提供其预测侧链的可信度。该可信度也可以代表该残基周围环境是否“舒适”。可信度越高,说明根据周围环境可以较容易的摆放该残基的侧链,其周围环境更接近训练集中的真实天然构象。这种通过侧链对局部环境的反馈来对对接构象进行打分的方法,突出了侧链在对接中的重要性,为目前其它的打分函数提供了良好的补充,从而有利于对蛋白质对接构象的筛选和对其相互作用过程的模拟,这也是多肽药物开发中的重要问题。
其结果显示,基于OPUS-Mut的评分函数OPUS-Mut
图4. 对蛋白质对接构象的评估结果。蓝色构象为受体蛋白的天然结构,红色构象为配体蛋白的天然结构,黄色构象为对接软件ZDOCK 3.0.2预测的排名前三的结果。“Ours”表示基于OPUS-Mut的评分函数OPUS-Mut
马剑鹏团队在蛋白质侧链建模问题中深耕已久,相继开发了OPUS-Rota、OPUS-Rota2、OPUS-Rota3、OPUS-Rota4及OPUS-Mut等一系列算法,分别对应不同的应用场景,为多肽药物研发提供了支持。
上海人工智能实验室计算生物学创新中心,以人工智能为技术中枢,构建新一代生物体系分析工具与方法,解读生物遗传信息,加速生命科学在分子层面的研究。通过对蛋白质、DNA等分子功能结构的预测与设计,打破生物数据壁垒,为生命科学研究提供新的思路与方法。