『书生』科学发现平台Intern-Discovery升级发布,跨学科、长周期、推理驱动 | AGI4S进行时

『书生』科学发现平台Intern-Discovery升级发布,跨学科、长周期、推理驱动 | AGI4S进行时

来源:上海人工智能实验室| 2026-02-11

当前,AI for Science正从辅助科研的“工具革命”1.0阶段,迈入以“革命的工具”驱动原始科学发现的2.0新时代。在此进程中,上海人工智能实验室(简称上海AI实验室)『书生』科学发现平台Intern-Discovery推出了全新升级的科学发现系统Intern·Agent 1.5,将自主科研智能体从“流程驱动”的工具升级为“推理驱动”的跨学科科学发现通用框架。

作为支撑Intern-Discovery的核心技术之一,Intern·Agent在1.0版本中聚焦算法设计任务,而Intern·Agent 1.5的核心创新在于构建了生成、验证、进化三大协同子系统,将科研抽象为可不断迭代的智能推理过程。这一转变使其不再局限于特定算法任务,而是能广泛应用于跨学科领域,为Intern-Discovery的持续升级奠定技术基础。其通用性已在地球科学、生物科学以及物质科学等学科中的跨领域任务上得到验证,并已在多个场景中将传统耗时数周乃至数月的流程压缩至小时或分钟级,实现了科研效率的实质性提升。

此次升级,正是上海AI实验室基于“创新冰山理论”开展有组织科研的典型实践:以Intern·Agent、科学智能上下文协议(SCP)为代表的原始创新,如同一块块珍贵的“冰块”,正共同构筑起支撑AGI for Science发展的坚实“冰山”。

技术报告:https://arxiv.org/abs/2602.08990

Huggingface: https://huggingface.co/papers/2602.08990

GitHub链接:https://github.com/InternScience/InternAgent

Intern-Discovery链接:https://discovery.intern-ai.org.cn/home

 

从流程驱动到推理驱动

研究团队于2025年7月推出多智能体框架Intern·Agent 1.0,让『书生』科学发现平台Intern-Discovery具备了多智能体专业协同的能力,进而打通从想法生成、方案设计到代码实现与实验验证的闭环流程,并在多个算法发现任务中获得显著效果。

在此基础上,Intern·Agent 1.5完成了从“流程驱动”的算法设计系统到“推理驱动”的跨学科科学发现系统级跃迁。不同于以固定流程编排为核心的范式,新版本将跨学科科研活动抽象为生成、验证、进化三大协同子系统:以推理为中枢完成问题建模与假设构建,以可验证反馈牵引方案迭代优化,并在长期运行中持续沉淀经验、推动能力演化。由此,Intern·Agent 1.5不再局限于算法发现类任务,而是形成同时适用于算法发现与实证发现任务的多学科通用科研框架。

 

639064046208860000.png

Intern·Agent 1.5可同时适用于算法发现与实证发现任务


三大子系统协同运行,支撑跨学科科学发现

639064046819570000.png

Intern·Agent 1.5架构图

Intern·Agent 1.5围绕科学研究的核心逻辑,构建了三大协同子系统:

    生成(Generation)子系统:负责跨学科文献理解、问题建模与研究假设构建,把分散信息组织成可检验的研究思路。

    验证(Verification)子系统:负责方案评估、多路径并行探索与持续优化,用更少轮次的试错筛选出更优方案。

    进化(Evolution)子系统:通过结构化记忆机制,沉淀有效策略与失败经验,支撑长期科研过程中的经验积累与能力提升。

为了支撑上述子系统的协同运行,系统围绕以下三大核心能力展开关键技术创新:

·    深度研究:通过动态结构化知识流构建科研任务的多层依赖图,并在多智能体框架下实现任务并行探索、知识递归整合和流程自适应优化,将不同领域的理论、方法与实验经验整合为可推理的知识表示,为生成子系统提供系统化的问题理解与研究假设构建支撑。

·    方案优化:在验证子系统中提出图增强蒙特卡洛搜索机制,重构解决方案探索的规划方式。不同于传统孤立的线性试错,该机制将搜索空间构建为动态图结构,支持历史轨迹回溯与跨分支知识融合,从“单点试错”走向“全局协同”,实现不同研究思路的碰撞与融合。

·    长时运行:通过引入结构化认知记忆与演化更新机制,系统在多轮科研过程中持续记录、筛选与重组历史研究轨迹、有效策略与失败经验,并将其抽象为可复用的长期先验,使进化子系统在跨阶段、跨任务的长期运行中保持决策一致性与推理稳定性,避免重复低效探索,并推动系统能力在长周期科研活动中的持续演进。

整体而言,Intern·Agent 1.5通过统一的子系统架构与核心能力设计,为跨学科自主科学发现提供了一个可持续演进的通用科学发现系统。在这一框架下,科学推理能力构成贯穿科研全流程的核心能力,决定了系统在不确定问题空间中的探索深度与可靠性。无论是面对“已知的未知”,还是尚未被清晰定义的“未知的未知”,科学推理能力都是系统能否有效开展科学发现的关键前提。

639064048316450000.png

Intern·Agent 1.5在多个科学推理基准上均取得良好表现

为系统性验证Intern·Agent 1.5的科学推理能力,科研团队在多项具有代表性的科学推理基准上对其进行了评测,包括GAIA、GPQA、HLE、FrontierScience和 SGI-bench等,重点考察其覆盖跨学科知识理解、复杂推理与开放问题求解能力,检验统一智能体框架在高难度推理场景下的表现。

实验结果表明,Intern·Agent 1.5在上述基准上均取得良好表现,进一步验证了生成、验证、进化三大子系统协同运行对科学推理任务的有效支撑。


统一框架,覆盖多学科科学发现任务

『书生』科学发现平台Intern-Discovery为载体,Intern·Agent 1.5已在多个学科的科学发现任务中进行实践,在复杂科研流程中表现出出色的推理与决策能力。

在生物科学领域,上海AI实验室与上海交通大学合作,基于Intern-Discovery成功开展了荧光蛋白定向优化与快速验证研究。该研究面向荧光标记与检测等需求,旨在更快发现并验证亮度更高、稳定性更好的荧光蛋白。研究流程从文献检索出发,自动识别并筛选高亮度、高稳定性的 eGFP 候选序列,并围绕性能目标完成计算分析与实验方案设计。随后,通过科学智能上下文协议(SCP) 调用干湿实验设备,完成合成、提纯和荧光亮度测定等实验流程,并最终生成结构化实验报告,完成实验闭环验证。传统以周为单位的实验周期被压缩至6小时,科研效率提升20倍以上。

中央广播电视总台“新闻直播间”的“开年聚智展新篇”特别节目,报Intern-Discovery在生物科学领域的能力

在地球科学领域,Intern-Discovery面向气象与气候应用任务,核心目标是将大尺度气候模型与多源观测数据转化为高精度、高分辨率的区域预测与评估套件。该研究基于地球科学理论,自主完成数据筛选与建模工具设计,构建端到端的智能降尺度管线,将传统需数周至数月的专家建模流程压缩至分钟级,并在精度与稳定性上显著优于传统统计方法,为区域气候研究提供高通量、可扩展的新范式。目前,上海亚太台风研究中心正在积极应用该方法搭建台风专用场景智能体“智台”,用以辅助台风过程中的业务预报和科学机理发现,并进一步在多国广泛应用。

639064066871470000.gif

Intern-Discovery自主完成气候数据筛选与建模工具设计,精准再现观测数据的空间分布和局部降水极值

在物质科学领域,上海AI实验室与中国科学技术大学合作,将Intern-Discovery应用于面向制药与材料研发中的分子设计与合成评估任务,覆盖复杂反应路径与产物分布预测,并支持面向目标理化性质的分子结构优化。在实际场景中,该项研究流程贯通了反应产物预测与分子骨架跃迁设计,深度融合了物理化学原理与原子守恒约束,在复杂反应及副产物预测准确性上显著优于传统主流方法。在标准反应预测基准上,主要产物预测取得0.86的Top‑1准确率和0.94的结构相似度,并在副产物预测任务中达到当前最优水平。在药物分子优化环节,联合团队通过多智能体生成式流程,实现从“命中化合物”到“先导分子”的结构演化,并协同提升溶解性与代谢稳定性,形成高效、可扩展的智能分子设计与物质创制新范式。

639064067363620000.png

Intern-Discovery从DprE1抑制剂命中化合物中识别核心骨架,生成并筛选多样化生物等排体,最终得到改良杂环与氟化修饰的候选分子

下一步,上海AI实验室将持续推进AGI4S相关技术研发,加快探索人工智能驱动的新型科研范式,并在更广泛的学科与更复杂的科研流程中形成可复用、可扩展的能力体系。

 


上海市徐汇区龙文路129号
国际传媒港L1楼

联系我们
comm@pjlab.org.cn