AGI4S
搜索文档
迈向AI4S 2.0,上海AI实验室开源书生万亿科学大模型Intern-S1-Pro
第一财经资讯· 2026-02-05 18:44
模型发布与核心定位 - 上海人工智能实验室于2月4日开源了万亿参数科学多模态大模型Intern-S1-Pro,旨在推动AI for Science从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代 [1] - 该模型是全球开源社区中参数规模最大的科学多模态模型,其核心科学能力实现质的跃升,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队 [1] 模型架构与技术突破 - Intern-S1-Pro基于混合专家架构,共拥有512个专家,总参数达1万亿,每次调用仅激活8个专家、220亿参数 [1] - 在底层架构上实现两大核心突破:通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉” [1][5] - 通过高效路由机制,系统攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈,为超大规模模型训练提供关键工程基础 [1][6][7] 性能表现与基准评测 - 在科学多模态评测中,Intern-S1-Pro在多个关键基准上表现优异,例如在SciReasoner综合科学推理基准得分为55.5,显著高于对比模型 [3] - 在化学分子结构任务Smollnstruct上得分为74.8,在材料性质预测Mat Bench上得分为72.8,在生物分子结构任务Mol-Instructions上得分为48.8 [3] - 在通用能力评测中,模型同样表现出色,如在知识推理基准MMLU-Pro上得分为86.6,在数学推理基准AIME-2025上得分为93.1,在智能体基准GAIA上得分为77.4 [4] 科学能力与学科覆盖 - Intern-S1-Pro构建了跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务 [8] - 在国际数学奥林匹克IMO-Answer-Bench和国际物理奥林匹克IPhO2025两大权威基准测试中,均展现出竞赛级别的解题能力 [8] - 模型能够精准解析复杂的分子结构图及各类实验图表,处理高阶科学问答,如反应条件推断、理化性质预测,应用范围从微观的化学逆合成拓展至宏观的遥感图像分析 [9] 算力与算法一体化基座 - 模型构建了原创的“算力-算法”一体化基座,从架构设计之初便与昇腾计算生态确立联合研发路线,实现了从底层算子到上层训练推理框架的深度全栈适配 [11] - 研发团队攻克了大规模训练中精度对齐、超长序列强化学习稳定性、硬件性能极致释放等一系列核心技术难题,基于XTuner V1训练框架和LMDeploy推理引擎确保了训练的高效与稳定 [11] 开源生态与行业影响 - 自书生大模型首次发布以来,公司已构建起丰富的模型家族,并开源了覆盖数据处理、预训练、微调、部署、评测与应用的全链路工具体系 [12] - Intern-S1多次登顶HuggingFace全球多模态榜单,累计下载超41万次,并获得近200家科研机构和企业的合作申请 [13] - 公司未来将推进Intern-S1及其全链条工具体系持续开源,支持免费商用,以降低全球科研门槛,共建开放的科学AI生态 [2][13]
迈向AI4S 2.0,上海AI实验室开源书生万亿科学大模型Intern-S1-Pro
第一财经· 2026-02-05 18:18
模型发布与定位 - 上海人工智能实验室于2月4日开源了万亿参数科学多模态大模型Intern-S1-Pro,旨在为AI for Science从1.0阶段迈向2.0时代提供创新的系统性开源基座 [2] - 该模型基于“通专融合”技术架构SAGE打造,是当前全球开源社区中参数规模最大的科学多模态模型,其核心科学能力实现了质的跃升 [2] - 模型旨在降低全球科研门槛,与学术界和产业界共同推动以通用人工智能驱动科学发现的范式革命 [3] 模型架构与技术突破 - Intern-S1-Pro基于混合专家架构,共拥有512个专家,总参数达1万亿,每次调用仅激活8个专家、220亿参数 [3] - 在基础模型层引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉” [3][8] - 通过高效路由机制,包括“路由稠密估计”和“分组路由”策略,攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈,为超大规模模型训练提供了关键的工程基础 [3][9] - 模型验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的AGI for Science基础设施奠定了坚实底座 [3] 性能表现与能力评估 - 在科学能力方面,模型在SciReasoner综合科学推理评测中得分为55.5,远超对比模型Qwen3-VL-235B-Thinking的11.9 [5] - 在多个AI4S关键垂类评测中表现优异,例如在SmolInstruct化学分子结构任务中得分为74.8,在MatBench材料性质预测中得分为72.8 [5] - 在通用能力方面,模型在MMLU-Pro知识推理评测中得分为86.6,在AIME-2025数学推理中得分为93.1,在GAIA智能体任务中得分为77.4 [6] - 在国际数学奥林匹克IMO-Answer-Bench和国际物理奥林匹克IPhO2025两大权威基准测试中,均展现出竞赛级别的解题能力 [10] - 模型构建了跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务,在综合学科评测中稳居AI4S领域第一梯队 [11] - 在智能体能力方面,在以动态环境与复杂交互为核心的Tau-2评测中达到了国际一流水平 [13] 应用场景与生态建设 - 模型能够精准解析复杂的分子结构图及各类实验图表,处理高阶科学问答,应用范围从微观层面的化学逆合成、蛋白质序列生成,拓展至宏观尺度的遥感图像分析等复杂任务 [12] - 上海AI实验室已构建起丰富的书生大模型家族,并首创并开源了面向大模型研发与应用的全链路开源工具体系,形成覆盖数十万开发者参与的活跃开源社区 [16] - Intern-S1自发布以来累计下载超41万次,并获得近200家科研机构和企业的合作申请,未来将继续推进开源,支持免费商用 [17]