模型共享、数据互通、设施互连的『书生』科学发现平台Intern-Discovery
模型共享:大模型+专业智能体即调即用
科学研究面临专业知识壁垒高、工具组合多样、流程复杂等特点,单一模型往往难以高效完成科研任务。Intern-Discovery集成共享了通专融合基座大模型和物理、化学、材料、生物、地球等多个领域的专业科研智能体。通过平台搭载的多智能体框架Intern·Agent,科研人员可调动多个专职智能体,以通用模型结合专业科学智能体的模式,助力科研人员从海量数据中识别潜在科学规律,实现跨学科的知识发现与方案创新。从想法生成到方案设计,再到代码实现、实验验证,Intern-Discovery为科研人员提供了全流程助力,帮助用户在更宽泛的信息背景下更好地理解科研各领域专业术语和研究方法,助力科学灵感高效转化为可验证成果。
目前,Intern-Discovery平台已提供200余个专业智能体供科研人员直接使用,覆盖六大学科领域的模型、智能体和实验工具链,包括凝聚态物理智能体、蛋白质实验智能体和化学反应空间聚类工具等。
为促进科研人员共同开发、共享科研智能体,推动科学智能生态共建,Intern-Discovery内置低代码开发环境,用户仅需通过可视化组件拖拽,即可快速完成科学智能体的开发与流程编排,共同推进科研模型、工具、智能体的标准化、通用化与共享化。平台还提供多个融合干湿实验的智能体工作流模板,支持多学科科研任务的一站式集成与执行,显著提升科研活动的协同效率与工具普惠能力。
科研人员可调动多个专职智能体,从海量数据中识别潜在科学规律,实现跨学科的知识发现与方案创新
数据互通:50家顶尖机构、200余专业数据集开架任选
针对科学研究场景中数据资源碎片化、高质量数据获取难、下载使用流程繁琐等难题,Intern-Discovery整合了来自欧洲生物信息研究所、欧洲中期气象预报中心等50家顶尖科研机构的高价值专业数据,在严格的开源许可与安全审核前提下,为平台用户开放共享。此举为科研人员提供了海量跨学科、跨机构的重要研究资源,有效打破“数据孤岛”,降低了科研流程中搜集、下载、使用科学数据的成本。
目前,平台中的科学数据广场共集成了200余个专业数据集,总量达PB级。数据集均精选自各学科高频使用的权威资源,例如生命科学领域的PDB数据库、AlphaFold蛋白数据库,以及地球科学领域的ERA5(欧洲气象中心全球气象再分析资料)数据集等。
上述专业数据集采用科学智能领域数据分类分级体系,按照生命科学、地球科学、物质科学、神经科学、空间科学、空气动力学等六大领域进行归类,便于科研人员快速获取。基于平台提供的集成算力,科研人员可以直接通过平台,对实验所需的数据进行自动搜索、AI-ready处理与建模开发,真正实现数据“能用、够用、好用”。
Intern-Discovery科学数据广场开放了200余个专业数据集,总量达PB级
设施互连:可支持百余种实验设备实时共享
在科研领域,高精尖实验设备的资源利用存在两方面显著问题:一方面,其开放共享程度普遍偏低,难以形成跨机构、跨领域的共享机制;另一方面,资源配置分散,难以形成协同攻关的合力。基于此现状,上海AI实验室推出科学智能上下文协议(Scientific intelligence Context Protocol,SCP)。通过创新融合跨域实验方法,SCP在智能体API的基础上提出了可兼容湿实验设备的设备API设计,可接入百余种厂商设备标准接口,覆盖生物、化学、材料等领域,为科学发现场景提供“万能转接器”,推动实验设备高效共享。
基于SCP,Intern-Discovery可直连第三方科研机构实验设施,支持科研人员远程调用智能体和实验设备,并由AI自动调度实验流程并分析结果,实验数据将实时反馈至模型,有效打破空间与组织边界,实现科研资源的共享与任务协同。
秉承开放共享理念,『书生』科学发现平台Intern-Discovery正携手全球顶尖科研机构共同推动人工智能在科学研究中的深度应用,并加速支撑多个重大攻关项目。未来,上海AI实验室将持续扩展Intern-Discovery的学科覆盖范围、基座模型能力、科学数据规模、智能体多样性、实验设施类型等,深化应用场景。诚邀全球机构、企业与科研学者一同共创科学未来。
了解关于『书生』科学发现平台Intern-Discovery的更多详情,请关注将于7月26日下午举办的WAIC 2025科学前沿全体会议,欢迎预约上海人工智能实验室视频号直播。
上海市徐汇区龙文路129号
国际传媒港L1楼
联系我们
comm@pjlab.org.cn
Copyright © 2025 Shanghai Artificial Intelligence Laboratory
沪ICP备2021009351号-1