迈向AI4S 2.0,上海AI实验室开源书生万亿科学大模型Intern-S1-Pro
第一财经资讯·2026-02-05 18:44

模型发布与核心定位 - 上海人工智能实验室于2月4日开源了万亿参数科学多模态大模型Intern-S1-Pro,旨在推动AI for Science从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代 [1] - 该模型是全球开源社区中参数规模最大的科学多模态模型,其核心科学能力实现质的跃升,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队 [1] 模型架构与技术突破 - Intern-S1-Pro基于混合专家架构,共拥有512个专家,总参数达1万亿,每次调用仅激活8个专家、220亿参数 [1] - 在底层架构上实现两大核心突破:通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉” [1][5] - 通过高效路由机制,系统攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈,为超大规模模型训练提供关键工程基础 [1][6][7] 性能表现与基准评测 - 在科学多模态评测中,Intern-S1-Pro在多个关键基准上表现优异,例如在SciReasoner综合科学推理基准得分为55.5,显著高于对比模型 [3] - 在化学分子结构任务Smollnstruct上得分为74.8,在材料性质预测Mat Bench上得分为72.8,在生物分子结构任务Mol-Instructions上得分为48.8 [3] - 在通用能力评测中,模型同样表现出色,如在知识推理基准MMLU-Pro上得分为86.6,在数学推理基准AIME-2025上得分为93.1,在智能体基准GAIA上得分为77.4 [4] 科学能力与学科覆盖 - Intern-S1-Pro构建了跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务 [8] - 在国际数学奥林匹克IMO-Answer-Bench和国际物理奥林匹克IPhO2025两大权威基准测试中,均展现出竞赛级别的解题能力 [8] - 模型能够精准解析复杂的分子结构图及各类实验图表,处理高阶科学问答,如反应条件推断、理化性质预测,应用范围从微观的化学逆合成拓展至宏观的遥感图像分析 [9] 算力与算法一体化基座 - 模型构建了原创的“算力-算法”一体化基座,从架构设计之初便与昇腾计算生态确立联合研发路线,实现了从底层算子到上层训练推理框架的深度全栈适配 [11] - 研发团队攻克了大规模训练中精度对齐、超长序列强化学习稳定性、硬件性能极致释放等一系列核心技术难题,基于XTuner V1训练框架和LMDeploy推理引擎确保了训练的高效与稳定 [11] 开源生态与行业影响 - 自书生大模型首次发布以来,公司已构建起丰富的模型家族,并开源了覆盖数据处理、预训练、微调、部署、评测与应用的全链路工具体系 [12] - Intern-S1多次登顶HuggingFace全球多模态榜单,累计下载超41万次,并获得近200家科研机构和企业的合作申请 [13] - 公司未来将推进Intern-S1及其全链条工具体系持续开源,支持免费商用,以降低全球科研门槛,共建开放的科学AI生态 [2][13]

迈向AI4S 2.0,上海AI实验室开源书生万亿科学大模型Intern-S1-Pro - Reportify