模型发布与定位 - 上海人工智能实验室于2月4日开源了万亿参数科学多模态大模型Intern-S1-Pro,旨在为AI for Science从1.0阶段迈向2.0时代提供创新的系统性开源基座 [2] - 该模型基于“通专融合”技术架构SAGE打造,是当前全球开源社区中参数规模最大的科学多模态模型,其核心科学能力实现了质的跃升 [2] - 模型旨在降低全球科研门槛,与学术界和产业界共同推动以通用人工智能驱动科学发现的范式革命 [3] 模型架构与技术突破 - Intern-S1-Pro基于混合专家架构,共拥有512个专家,总参数达1万亿,每次调用仅激活8个专家、220亿参数 [3] - 在基础模型层引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉” [3][8] - 通过高效路由机制,包括“路由稠密估计”和“分组路由”策略,攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈,为超大规模模型训练提供了关键的工程基础 [3][9] - 模型验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的AGI for Science基础设施奠定了坚实底座 [3] 性能表现与能力评估 - 在科学能力方面,模型在SciReasoner综合科学推理评测中得分为55.5,远超对比模型Qwen3-VL-235B-Thinking的11.9 [5] - 在多个AI4S关键垂类评测中表现优异,例如在SmolInstruct化学分子结构任务中得分为74.8,在MatBench材料性质预测中得分为72.8 [5] - 在通用能力方面,模型在MMLU-Pro知识推理评测中得分为86.6,在AIME-2025数学推理中得分为93.1,在GAIA智能体任务中得分为77.4 [6] - 在国际数学奥林匹克IMO-Answer-Bench和国际物理奥林匹克IPhO2025两大权威基准测试中,均展现出竞赛级别的解题能力 [10] - 模型构建了跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务,在综合学科评测中稳居AI4S领域第一梯队 [11] - 在智能体能力方面,在以动态环境与复杂交互为核心的Tau-2评测中达到了国际一流水平 [13] 应用场景与生态建设 - 模型能够精准解析复杂的分子结构图及各类实验图表,处理高阶科学问答,应用范围从微观层面的化学逆合成、蛋白质序列生成,拓展至宏观尺度的遥感图像分析等复杂任务 [12] - 上海AI实验室已构建起丰富的书生大模型家族,并首创并开源了面向大模型研发与应用的全链路开源工具体系,形成覆盖数十万开发者参与的活跃开源社区 [16] - Intern-S1自发布以来累计下载超41万次,并获得近200家科研机构和企业的合作申请,未来将继续推进开源,支持免费商用 [17]
迈向AI4S 2.0,上海AI实验室开源书生万亿科学大模型Intern-S1-Pro
第一财经·2026-02-05 18:18