破解组合爆炸难题,上海AI实验室提出化学逆合成规划新框架 | AGI4S进行时

破解组合爆炸难题,上海AI实验室提出化学逆合成规划新框架 | AGI4S进行时

来源:上海人工智能实验室| 2026-05-07

逆合成作为化学合成规划的核心,正成为深度学习与大语言模型竞逐的重要方向。其瓶颈在于,需从目标分子出发,每一步逆推都可能有数十至数百个前体,合成路线组合呈指数级扩增。

近期,上海人工智能实验室(上海AI实验室)联合香港中文大学(深圳)等团队开展相关探索,让AI像“化学家”一样自主规划完整合成路线,从而加速药物研发与新材料发现。最新进展包括:

  • 面向多步逆合成规划,创新融合大语言模型与树搜索算法,提出全新框架AOT*(LLM-Empowered AND-OR Tree      Search,基于大语言模型的与或树搜索算法),可高效筛选出可行的完整合成路线;

  • 聚焦单步逆合成生成,提出结构感知的离散流匹配方法RetroDiT,提升AI单步反应拆解的准确性、多样性及化学合理性。

目前,上述研究形成的部分技术能力和方法,已在头部高通量化学合成企业的研发场景中开展落地验证,服务于反应筛选、路线评估和实验优先级决策等关键环节,并成功在一周内为重要靶向药物的中间体找到合成路径。

AOT*相关论文:https://arxiv.org/abs/2509.20988


AOT*:让大语言模型具备多步逆合成规划能力

多步逆合成规划(Multi-step Retrosynthetic Planning)是指从目标分子出发,递归逆推出所有中间体,进而寻找一条从简单、可购买的原料出发的合成路径,是化学领域一项基础且极具挑战性的任务。

传统方法多依赖单步预测模型迭代搜索,存在搜索成本高、整体运行效率不足的短板。大语言模型虽具备一定的化学推理能力,但如何将其稳定、高效地用于多步规划,仍然是AI for Chemstry领域的关键科学问题。

为破解这一难题,研究团队提出AOT*框架——将大语言模型生成候选合成路径的能力与AND-OR树的系统化搜索机制深度结合。与以往逐步扩展单个反应不同,AOT*直接以“合成路径”为生成单位,再将生成结果原子级映射到AND-OR树结构中,既保留了路线级推理的全局一致性,又充分发挥了树搜索在中间体复用、冗余剪枝及结构化记忆上的独特优势。

639137687164700000.png

AOT*结合大模型和化学反应与AND-OR树的结构化搜索示意图

实验结果表明,AOT*在多个经典评测基准上达到当前最优或具有竞争力的性能,并在搜索效率上实现显著突破:

  • 在多项任务上,AOT*可用1/3–1/5或更少的迭代次数达到与现有方法相当甚至更优的求解率;

  • 在更复杂的目标分子上优势更加明显,充分验证其在高难度化学空间中的高效搜索能力;

  • 该性能增益可适配多款大语言模型后端,证明核心优势源于算法框架设计,而非依赖特定模型底座。

639137688090440000.png

639137688327500000.png

AOT*的意义不仅在于“把大模型用到了合成规划里”,更在于提出了一种新的方法范式:让语言模型负责高层化学推理,让结构化搜索负责全局优化与中间体复用。这一思路为构建面向真实研发流程的智能合成规划系统提供了重要方法基础,也为大模型在科学任务中的可控使用提供了新的实践路径。

 在应用层面,AOT* 所体现出的高效搜索与路线优选能力,也与高通量化学研发场景高度契合。当前,相关能力已在部分产业研发流程中开展应用验证,用于提升复杂分子的路线筛选效率,并降低人工规划和实验试错成本。


RetroDiT:把化学先验编码进生成模型,让单步逆合成更“懂化学”

如果说AOT*解决了多步合成路线的高效规划难题,那么单步逆合成模型RetroDiT,则聚焦解决分子每一步的精准拆解问题。

单步逆合成是合成规划体系的基础。现有无模板(Template-free)方法灵活性较强,但多以黑盒方式完成生成,难以充分利用化学反应本身所蕴含的结构规律。另外,化学家开展逆合成分析时,普遍遵循先锁定反应中心、再推导前体结构的两阶段思路,而主流端到端生成模型,尚未对这一化学逻辑进行显性建模。

围绕这一科学问题,研究团队提出创新破局思路:原子排列顺序具备关键化学意义,恰当的排序本身可以成为强有力的化学先验。基于这一思路,团队提出了RetroDiT方法,以反应中心为基准重构分子图中的原子序列,将最关键的反应中心原子放在序列前端,从而把“先定位反应中心、再生成反应物”的化学逻辑,转化为模型更易学习的位置模式。同时,团队设计了带有旋转位置编码的图Transformer主干网络,并结合离散流匹配(Discrete Flow Matching),实现了兼顾精度与效率的单步逆合成生成。

639137701068950000.png

RetroDiT引入化学反应中心的顺序归纳偏置,并将训练过程和采样过程解耦

RetroDiT在多个数据集上的实验结果显示出强劲性能:

  • 在USPTO-50k上,使用预测反应中心时取得61.2% Top-1准确率;使用真值反应中心时达到71.1% Top-1准确率;

  • 在更大规模的USPTO-Full上,两类条件下Top-1准确率分别达到51.3%和63.4%;

  • 训练门槛低,不需要大算力和海量数据支持,训练效率更高,并且可以生成多样的可行反应;

  • 推理代价小,相比传统扩散式方法约500步采样需求,RetroDiT仅需20–50步即可完成单步逆合成生成。

639137701683230000.png

639137702053200000.png

RetroDiT用了更小的模型,更少的训练样本,达到了专用大模型才能达到的性能

更值得关注的是,RetroDiT的消融实验揭示了一个具有普遍意义的结论:在化学生成任务中,合理的归纳偏置设计,有时比单纯扩大模型规模更有效。实验证实,仅28万参数的轻量化模型,依托科学的分子结构排序设计,性能即可比肩乃至超越未加入该类约束的大模型。这也表明,针对特定科学问题定制归纳偏置,仍是AI for Science(AI4S)领域极具价值的核心研究方向。

 从应用视角看,RetroDiT所代表的单步逆合成能力,可高效支撑高通量研发中的反应方案生成、前体筛选与反应条件探索。相关技术思路已在产业场景中展现出较好的适配性,为智能化学平台中的“反应建议引擎”提供了可扩展的基础。


从“能预测”到“会规划”:构建更接近真实研发需求的化学智能系统

AOT*和RetroDiT两项工作,分别对应化学合成规划中的两个关键层次:AOT*面向多步,提升路线搜索的全局效率与复杂目标求解能力,决定模型是否真正“懂化学”;RetroDiT面向单步,提升模型对化学结构规律的理解与生成能力,决定系统能否在复杂空间中高效找到真正有价值的路线。

二者共同揭示出一条清晰的研究方向:化学合成规划不能只依赖更大模型或更多数据,还需要面向化学本质设计结构化表示、搜索机制与推理框架。这也是上海AI实验室在科学智能方向持续关注的核心问题之一——如何把通用人工智能能力,与学科知识、结构先验和实验约束有机结合,真正推动人工智能从“会预测”走向“会规划、会推理、能执行”。

·       在这一过程中,团队围绕化学结构匹配、反应可行性评估等问题开展了进一步探索。例如,神经递进分配(Neural Graduated Assignment)方法在化学相似性建模方面和高效构建化学空间方面提供了新的基础工具;另有合作研究将高通量实验与贝叶斯深度学习结合,用于反应可行性和稳健性的评估。这些探索共同指向一个更长远的目标:构建面向真实科研与工业流程的全链路化学智能系统,加速推动AI4S从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代。

近期,上海AI实验室发布面向重大科学研究突破的“AGI for Science珠穆朗玛计划”(AGI4S珠穆朗玛计划),全面开放算力、数据、模型、平台、场景、项目、人才全维度合作通道,旨在构建“科学智能创新中枢”,打造领先的AGI4S基座能力,汇聚科学智能创新全要素,助力全球科学家攀登科学高峰。AOT*、RetroDiT为近期在化学逆合成领域取得的原创突破。未来,联合科研团队将以此为基础,攀登AI for Chemstry领域更多高峰。


上海市徐汇区龙文路129号
国际传媒港L1楼

联系我们
comm@pjlab.org.cn