多元破壁:AGI4S 2025突破与探索
2026-01-04
2025年,人工智能继续以一日千里的速度刷新纪录与重塑认知,其在科学领域的应用,正引发一场前所未有的革命,不仅挑战着我们对科学问题的理解,还可能重塑未来的知识边界。
上海人工智能实验室主任、首席科学家周伯文教授提出“AGI for Science 之六问”,提供了一个思考框架:既需清醒认识到当下可能被高估的能力边界、预测可靠性与语言表征的局限,也要关注那些被低估的远方——尤其是交叉学科的涌现、验证机制的建立和新科学范式的形成。
以下汇总了上海人工智能实验室(上海AI实验室)在2025年的一些重要工作,包括科学大模型的进展、十个科学领域的前沿探索、关于AGI4S的洞察,以及创新的合作与人才机制——这些探索来自实验室以及与我们并肩同行的伙伴,正是不断突破机构、学科与领域的“次元壁”,让我们得以共同书写一座座里程碑,携手勾勒出AGI4S未来的早期轮廓。
上海人工智能实验室主任、首席科学家周伯文教授在2025浦江创新论坛提出“AGI for Science 之六问”
锻造基座:通专融合的世界级科研大模型
上海AI实验室于2024年7月即提出通专融合是通往AGI的战略路径,并于今年进一步推出“SAGE”(Synergistic Architecture for Generalized Expertise)技术架构:基础模型层、融合协同层以及探索进化层三层并行、闭环反哺,使大模型在科学发现中由“工具”升维为“引擎”。
在基础模型层,今年7月发布的『书生』科学多模态大模型Intern-S1打造了坚实的“科研基座”,将顶尖的跨模态科学理解能力转化为驱动进步的生产力,并通过开源开放显著降低了全球科研团队开启进入AGI for Science时代的门槛。Intern-S1在同一模型内实现了语言和多模态性能的高水平均衡发展,并富集多学科专业知识,重点强化了科学能力,在化学、材料、地球等多学科专业任务基准上超越了顶尖闭源模型Grok-4;此外,Intern-S1还开创了“多任务的通专融合”的新范式,支持大规模多任务强化学习齐头并进,在保持能力全面的同时实现专业精通。

Intern-S1交互页面,体验链接:https://chat.intern-ai.org.cn/
Intern-S1发布后连续多日登顶HuggingFace多模态榜单全球榜首,累计下载量超36万,近200家海内外顶尖科研机构、知名企业发来合作申请。
2025年,研究团队在Intern-S1的基础上持续迭代,接连攻克复杂数理推理问题。
物理方面,探索了大规模、多阶段强化学习提升物理专业能力,在OpenAI最新发布的FrontierScience-Olympiad榜单上超越所有开源模型。
数学方面,首创“通用模型+专业符号引擎”协作路线,克服了传统专用模型缺乏泛化性的瓶颈。在几何证明场景中,仅用万分之一训练样本即超越谷歌AlphaGeometry2,证明了该路线结合各学科专业工具、大规模赋能科学研究的可行性与高效性。
今年11月,全国中学生数学奥林匹克竞赛首设AI测试,Intern-S1应邀出战,以102分(满分126分)位列大模型得分榜第一名,远超金牌线78分和国家集训队入选线87分。阅卷专家评价“答案表达方式非常接近人类”,其中对第四题的解答是“一个新的解法,巧妙的调整法,在学生的解法中没有见过”——这标志着Intern-S1不仅在表达逻辑的严谨性和推理能力方面达到专业级水准,还能突破人类解题思路局限,通过自主探索和分析找到新的解题方法,为进一步赋能科学发现夯实技术基础。目前,国内多个科研机构正与实验室团队合作,将Intern-S1应用到前沿数学研究。
实验室基于『书生』技术打造的科学智能文档语料解析引擎MinerU,可深度解析复杂版面,精准识别并转换图文、公式、表格等多模态元素,高效实现私域文档到高质量AI-Ready语料的解析。截至目前,其在GitHub获得超过5万星标,已为超过200家机构和企业提供超8亿次科学数据解析服务,超25万用户覆盖科研、教育、政企等领域。
此外,在围棋、美学等方面,『书生』也取得不俗表现。4月,实验室推出的书生·思客(InternThinker)为首个既具备围棋专业水平,又能展示透明思维链的大模型。7月,实验室与中国美术学院联合推出国内首个专业级美学理解大模型书生·妙析ArtiMuse,该模型可对多种类图像进行精细化、多维度分项评估,为艺术教育、审美评价、美育普及提供量化工具。
SAGE架构中更多通专融合进展包括:

第一层为基础模型层,旨在构建通用泛化基础能力和高密度监督的专业能力。
“记忆体+解码器”大模型架构Memory Decoder (2025年8月,Memory Decoder: A Pretrained, Plug-and-Play Memory for Large Language Models)
第二层为融合协同层,通过多路线协同构建比肩人类专家的通专融合能力。
强化学习算法PRIME(2025年2月,Process Reinforcement through Implicit Rewards)
基于结果奖励的强化学习新范式OREAL(2025年2月,Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning)
第三层为探索进化层,通过自主探索与反馈修正实现AI自我进化闭环。
InternBootcamp:通过可验证任务扩展提升大语言模型推理能力(2025年8月,InternBootcamp Technical Report: Boosting LLM Reasoning with Verifiable Task Scaling)
测试时强化学习(TTRL)框架(2025年4月,TTRL: Test-Time Reinforcement Learning)
Retro-R1:基于大语言模型的智能体逆合成 (2025年10月,Retro-R1: LLM-based Agentic Retrosynthesis)
见证突破:刷新纪录的科学智能探索
从60毫秒完成2024个量子比特的无缺陷排布,到设计超导材料生产工艺;从单细胞级别精准检测癌症,到自主发现并验证癌症治疗新靶点,从分钟级实现全球气候变化分析到追踪太空多碎片……每一项探索都标志着AI正在刷新记录与认知,重构科学发现的新范式。
以下仅为“与书生共创”的部分创新探索,2026年我们将陆续推出更多“人工智能+科学发展”的实践。

以AI算法攻克量子比特规模化精准制备的核心瓶颈,为量子计算机走向实际应用解决了核心难题。上海AI实验室联合中国科学技术大学、合肥实验室推出了全球首个基于人工智能的量子计算中性原子排布算法,利用AI技术并行驱动所有原子,仅用时60毫秒,便成功构建了最高达到2024个原子的二维和三维无缺陷阵列,规模刷新了世界纪录。该方法攻克了传统技术中重排耗时随原子数增加而激增的核心瓶颈,实现了与阵列规模无关的恒定时间消耗,为未来在极短时间内构建数万乃至更大规模的无缺陷原子阵列,甚至为高性能量子计算机的研发奠定了坚实的技术基础。美国物理学会旗下的《Physics》(物理)网站将上述相关成果列入2025年度亮点工作( Highlights of the Year)。
薛定谔猫思想实验的原子视频,549个闪烁的“像素”,每一个都是被人类精准捕获、操纵的铷原子

以AI驱动的动态光场重构,突破传统光学设计的物理规则瓶颈。上海AI实验室联合复旦大学等机构研发了新一代裸眼3D显示系统书生·瞳真EyeReal,解决了大尺寸与超宽连续视角难以兼得的难题,并为受困于经典物理权衡的硬件领域(如光学、声学、材料)开辟了一条由智能驱动根本性创新的新路径。传统裸眼3D显示技术以静态方式将有限信息量均匀分配至所有可视角度,而EyeReal开创了动态模式——通过AI深度学习算法进行实时计算,将有限的显示资源精确地传递至观看者的双眼从而实现裸眼3D,并大幅提升观看体验。该技术完全兼容消费级液晶面板,无需复杂的光学元件或特制硬件,首次实现了在桌面级显示尺寸内,超过100度超宽视场角、包含全部视差类型(水平、垂直、径向、连续与焦点)的实时三维显示。国际顶级学术期刊《Nature》正刊发表该成果相关论文并评价其为:光学信息运用的全新范式,有望在教育工具、虚拟现实等领域开拓创新应用。

论文链接:https://www.nature.com/articles/s41586-025-09752-y

以多智能体协作的“全流程探索引擎”,驱动靶点发现从“经验试错”走向“系统涌现”。上海AI实验室与临港实验室、上海交通大学、复旦大学、MIT等研究机构紧密协作,构建了多智能体虚拟疾病学家系统——“元生”(OriGene),传统创新药物靶点发现长期依赖分散的文献挖掘与试错式实验,面临“大海捞针”式的低效困境——海量组学数据与潜在机制难以系统关联,从假说到实验验证周期漫长且成功率低。OriGene可自动发现并验证创新治疗靶点,实现从数据到机制、从假说到验证的全流程智能化,推动AI驱动靶点及药物发现“新范式”。目前,OriGene已在肝癌和结直肠癌治疗上分别提出新靶点GPR160和ARG2,被真实临床样本和动物实验验证形成科学闭环,展示了AI缩短药物研发周期的巨大潜力。

突破传统育种研究的低通量实验之困,开创由智能体驱动的基因解码新路径。上海AI实验室联合崖州湾实验室、中国农业大学推出生物育种领域首个自主科学发现系统“丰登·基因科学家”(GeneScientist),以可自主规划与推理的“科研智能体”系统,辅助发现了未被报道的基因功能。作物基因功能研究长期依赖分子生物学家的假设驱动与“一对一的”湿实验验证,流程繁琐、通量低下。基于种业大模型“书生·丰登”的知识底座,GeneScientist具备自主科学问题发现与实验策略规划能力,能模拟顶级分子生物学家的思维范式,自主完成从数据挖掘、假说生成、实验模拟到结果分析的完整研究循环,实现了从“人操作模型”到“模型驱动发现”的范式升级。该系统目前应用于两百家海内外机构,已在主粮作物中自主发现数十个全新基因功能并获实验证实。
“丰登·基因科学家”具备自主科学问题发现与实验策略规划能力

突破超导材料研发的试错成本与性能权衡瓶颈,为加速超导新材料研发探索出新路径。上海AI实验室联合中国科学院物理研究所、中国科学院凝聚态物质科学数据中心推出凝聚态物质科学全栈式智能科学发现系统,以全栈式智能系统的“高通量计算-性能预测”闭环,首次实现了AI预测的铜基超导材料新组分在强磁场下的临界电流密度达到实用级商业产品标准,为超导新材料研发树立了从AI设计到实验验证的实用化标杆。目前,该系统已部署至综合极端条件大科学装置数据平台,基于该系统设计和优化实现了多个铜基超导材料新组分,在低温高场和高温低场的临界电流密度超过实用级商业产品标准。

AI智能体系统为高效处理海量地球系统数据探索出人机协同新范式。上海AI实验室联合中国科学院大气物理研究所、中国气象科学研究院推出AI地球科学家智能体系统EarthLink,作为首个能够自动化整个地球科学研究流程的人工智能“助手”,EarthLink可全自动处理海量地球科学数据,将传统需3–5周的科研流程大幅压缩至5–8小时,使科学家得以聚焦于核心假设验证。基于900多条专家评分,其在核心气候任务上性能媲美初级科学家,获世界天气研究计划(WWRP)前季风委员会主席Chih-Pei Chang与欧洲海洋院院士Toshio Yamagata等国际权威高度评价,“为解决地球科学数据碎片化问题和地球科学研究速度带来突破性的转变”。目前,EarthLink 已开放试用申请,吸引来自全球70余家科研机构关注使用。

智能感知与跟踪框架助力深空探测,实现从“断续捕获”到“稳定连续”的追踪能力跃升。上海AI实验室联合中国极地研究中心推出的面向多碎片目标的人工智能跟踪系统,在高精度数值模拟评估场景下,取得了相比传统视觉计算跟踪方法70%的精度提升。该方法已部署在中国极地研究中心中山站310mm空间碎片望远镜后端,并在南极真实观测数据上进行了测试,首次取得了高效实时多碎片追踪结果,为构建下一代智能空间态势感知系统提供了核心技术基础。

多智能体协同,突破化学反应优化的高维搜索与知识隔离瓶颈,在诺奖反应体系中实现“数量级”性能提升。上海AI实验室联合同济大学推出化学反应优化多智能体ChemBOMAS,该框架通过将化学知识引导的粗粒度搜索与数据驱动的精细优化相结合,实现了反应空间的有效划分与高质量数据的快速积累,从而显著提升优化效率。钯催化偶联反应降低催化剂用量,成本降低10倍,效率优化50%以上。该系统已经在相关药企所需要的抗菌药前体合成中得到验证。

破解储能材料能效-安全-寿命的“不可能三角”,为长时储能产业化按下快进键。上海AI实验室与中海储能、中国石油大学合作研发的分子-电网工业智能体,实现从电解液分子设计到电网调峰的全链条智能贯通,使研发效率与性能倍增。传统铁铬液流电池等储能技术的核心材料(如电解液)开发,长期受困于能量密度、循环寿命与安全性三者难以兼顾。通过传统实验手段寻求平衡点,研发周期动辄以年计。该研究构建了能同时从分子特性与电网级应用需求两端进行建模与优化的工业智能体,打破了从微观分子设计到宏观系统性能之间的模拟壁垒,将研发周期缩短至几个月,电池综合性能提升超100%。目前相关成果已部署在张家口怀来数据中心的兆瓦时级装置上,并将在广东惠阳的全国首个百兆瓦时级储能电站中落地。
分子-电网工业智能体工作原理

以“端到端”智能解析科学大模型突破效率之困。上海AI实验室联合武汉大学,国仪量子研发的电子顺磁共振谱解析大模型书生·言普(IS-EPR),依托智能自动谱图解析系统和前沿海量的顺磁物种数据,解谱准确率可媲美人类专家,解谱速度从数小时压缩至秒级。在创新模型与算法的基础上,IS-EPR充分发挥了人工智能在数据处理和知识获取方面的优势,可在EPR波谱的优化、拟合、和归属等阶段多维度提升效率。目前,该模型已搭载在国仪量子原创的设备上,助力国产EPR谱仪从0%的市场占有率跃升至85%,在“AI+高端科学仪器”领域实现行业领先。
重塑认知:革命工具推动科学发现群体“涌现”
上述10个领域的阶段性进展,代表了当前人工智能在科学研究领域推动的局部突破。如何更进一步,实现科学发现的群体“涌现”?
上海AI实验室致力于以“通专融合”路径实现通用人工智能(AGI),进而提出科学探索“三元论”:科学研究为研究者、研究工具和研究对象三大要素的总和,三者构成动态系统而非孤立节点——通过人工智能促进三者相互作用、协同演进、螺旋式上升,将创造出真正“革命的工具”,推动科研范式变革。
针对研究者,AI可以通过跨学科知识关联与深度推理,助力其打破认知壁垒和学科茧房,产生跨领域颠覆性的想法;针对研究工具,AI可以实现海量专业工具的自适应创新性调用,克服组合爆炸,甚至可以根据研究需要,自主构建新工具,高效完成长流程复杂科研任务;针对研究对象,AI可以通过智能选择、解析与关联,实现对研究对象的高效利用、创新理解和深度协同。

研究者、研究工具、研究对象相互作用、协同演进、螺旋式上升
作为科学智能“革命的工具”核心实践,上海AI实验室推出了『书生』科学发现平台Intern-Discovery,通过模型共享、数据互通、设施互连,实现人机协同、数算一体、干湿结合的科研全流程一站式支撑。其中,科学发现系统Intern·Agent,通过调动多个专职智能体各司其职协同工作,使AI获得类似人类科学家的自主探索能力,实现“想法生成-方案设计-代码实现-实验验证”全流程闭环。该系统当前已支持化学反应产率预测、生物学增强子活性预测、电力流预测、文本情感分析、智能体记忆,强化学习等20多个科学场景,支持调用超1000个工具。
针对科学研究场景中数据资源碎片化、高质量数据获取难、下载使用流程繁琐等难题,Intern-Discovery整合了50多家顶尖科研机构的高价值专业数据,200余个专业数据集,总量达集成了PB级,并在严格的开源许可与安全审核前提下,为平台用户开放共享。

Intern-Discovery科学数据广场开放了200余个专业数据集,总量达PB级
在设施互连方面,上海AI实验室联合十余家科研机构共同推出科学智能上下文协议(Scientific intelligence Context Protocol,SCP),实现了链接数据、工具、智能体、专业模型、湿实验设备等科研要素及API化整合,助力多智能体的高效协同。目前,SCP已公开六大学科的1600余种科学发现工具 API,为超过500家科研机构提供了跨领域科学发现的标准化环境,大幅提升多智能体协作效率。
SCP为科学发现平台及模型提供“万能转接器”,推动科学智能开放生态建设
为科学、客观地衡量模型在真实科研场景中的能力,上海AI实验室构建了面向多学科、多模态的科学智能评测体系,提出面向科学发现全流程的评测基准,评测范围覆盖地球、生命和物质科学等10大类学科下的75个重要科学方向,为科学发现全流程中的AI能力定量评估提供重要支撑。
激活未来:面向AGI4S的创新机制
作为人工智能领域新型科研机构,上海AI实验室正发挥“连接器、放大器、加速器”三大核心功能,持续推动技术突破与产业应用的深度融合。
2025浦江创新论坛期间,上海AI实验室联合多家科研机构共同发起科学智能战略科技力量联盟,通过有组织科研,推动各学科领域与人工智能领域深度融合,实现从理论突破到应用落地的全链条闭环,为加快推动高水平科技自立自强、建设科技强国贡献力量。
“人工智能是年轻的事业,也是年轻人的事业。”
2025年4月29日,对于实验室的刘翼豪等10位青年研究人员而言,是个值得铭记的“高光时刻”。他们作为代表与正在模速空间调研的习近平总书记面对面交流。《解放日报》头版发文,通过青年研究人员的群像刻画,聚焦报道了实验室优良的科研环境和氛围,以及通过“三梯合一”发展通道、“奥斯卡”式激励等创新人才机制,帮助更多年轻人实现多维价值,让每位人才都有高光时刻。

当前,青年科研人员正成为实验室中流砥柱,以年轻人的活力和智慧成就人工智能年轻的事业。2025年,实验室探索构建浦江科学社区,广泛链接国内外优秀科研团队和人才,打造战略科技人才蓄水池,并通过明珠湖会议、星河论坛等学术活动,鼓励有志于挑战科学边界的科学家发现问题、提出问题。
7月26日,是2025年的另一个高光时刻。在世界人工智能大会科学前沿全体会议现场,诺贝尔奖及图灵奖得主、“AI教父”Geoffrey Hinton与周伯文教授开展了一场浓缩高密度智慧的尖峰对话。

77岁的Hinton第一次飞越重洋来到中国。在短短17分钟的对话中,两位科学家从多模态大模型的“主观体验”、词汇与“意识”,谈到如何训练“善良”的超级智能、AI如何辅助科学发现,并给年轻科学家留下宝贵的建议:寻找那些你认为“所有人都搞错了”的领域,这正是重大突破性创新的起点。

扫描二维码,或点击【阅读原文】查看最新招聘岗位
2026,欢迎全球顶尖科研青年加入上海人工智能实验室,携手国际级人工智能新型科研机构,一起定义AGI未来。

