迈向AI4S 2.0，上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

模型发布与核心定位 - 上海人工智能实验室于2月4日开源了万亿参数科学多模态大模型Intern-S1-Pro，旨在推动AI for Science从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代 [1] - 该模型是全球开源社区中参数规模最大的科学多模态模型，其核心科学能力实现质的跃升，复杂数理逻辑推理能力达奥赛金牌水平，面向真实科研流程的智能体能力位居开源模型第一梯队 [1] 模型架构与技术突破 - Intern-S1-Pro基于混合专家架构，共拥有512个专家，总参数达1万亿，每次调用仅激活8个专家、220亿参数 [1] - 在底层架构上实现两大核心突破：通过引入傅里叶位置编码并重构时序编码器，赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉” [1][5] - 通过高效路由机制，系统攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈，为超大规模模型训练提供关键工程基础 [1][6][7] 性能表现与基准评测 - 在科学多模态评测中，Intern-S1-Pro在多个关键基准上表现优异，例如在SciReasoner综合科学推理基准得分为55.5，显著高于对比模型 [3] - 在化学分子结构任务Smollnstruct上得分为74.8，在材料性质预测Mat Bench上得分为72.8，在生物分子结构任务Mol-Instructions上得分为48.8 [3] - 在通用能力评测中，模型同样表现出色，如在知识推理基准MMLU-Pro上得分为86.6，在数学推理基准AIME-2025上得分为93.1，在智能体基准GAIA上得分为77.4 [4] 科学能力与学科覆盖 - Intern-S1-Pro构建了跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵，涵盖100多个专业子任务 [8] - 在国际数学奥林匹克IMO-Answer-Bench和国际物理奥林匹克IPhO2025两大权威基准测试中，均展现出竞赛级别的解题能力 [8] - 模型能够精准解析复杂的分子结构图及各类实验图表，处理高阶科学问答，如反应条件推断、理化性质预测，应用范围从微观的化学逆合成拓展至宏观的遥感图像分析 [9] 算力与算法一体化基座 - 模型构建了原创的“算力-算法”一体化基座，从架构设计之初便与昇腾计算生态确立联合研发路线，实现了从底层算子到上层训练推理框架的深度全栈适配 [11] - 研发团队攻克了大规模训练中精度对齐、超长序列强化学习稳定性、硬件性能极致释放等一系列核心技术难题，基于XTuner V1训练框架和LMDeploy推理引擎确保了训练的高效与稳定 [11] 开源生态与行业影响 - 自书生大模型首次发布以来，公司已构建起丰富的模型家族，并开源了覆盖数据处理、预训练、微调、部署、评测与应用的全链路工具体系 [12] - Intern-S1多次登顶HuggingFace全球多模态榜单，累计下载超41万次，并获得近200家科研机构和企业的合作申请 [13] - 公司未来将推进Intern-S1及其全链条工具体系持续开源，支持免费商用，以降低全球科研门槛，共建开放的科学AI生态 [2][13]