上海人工智能实验室开源书生万亿科学大模型

模型发布与战略意义 - 上海人工智能实验室开源了基于“通专融合”SAGE架构的万亿参数科学多模态大模型Intern-S1-Pro，旨在为AI for Science从1.0“工具革命”迈向2.0“革命的工具”时代提供系统性开源基座 [1] - 该模型是全球开源社区中参数规模最大的科学多模态模型之一，其性能稳居全球第一梯队，通过SAGE基础模型层技术创新拓宽了应用边界并提升了超大规模训练可行性 [1] - 公司提出“可深度专业化通用模型”是实现通用人工智能的可行路径，其关键挑战在于低成本规模化反馈、持续主动学习、多解决方案能力以及引入物理世界规律 [1] 核心技术突破 - 研究团队引入傅里叶位置编码并重构时序编码器，使模型能同时以“粒子”视角捕捉相对距离和以“波”视角把握科学信号整体规律与频率 [2] - 基于自适应数据密度的时序编码器，模型首次能统一处理从寥寥数个到百万级采样的各类信号，支持的分析对象从天文学、地理学拓展至生理信号、生物声学等领域 [2] - 为高效训练万亿参数模型，团队革新了内部“路由机制”，通过“路由稠密估计”提升学习充分性与稳定性，并通过“分组路由”策略实现海量计算芯片的负载均衡，避免资源闲置 [2] 系统与生态成就 - Intern-S1-Pro同时攻克了超大规模模型训练在“学习效率”和“资源调度”上的核心瓶颈，为高效稳健训练下一代万亿参数模型提供了关键基础 [3] - 该模型验证了从原创模型架构到国产算力基座自主技术的完整链路，从架构设计之初就与昇腾计算生态确立了联合研发路线，实现了从底层算子、编译优化到上层训练、推理框架的深度全栈适配 [3] - 模型还与沐曦联合研发利用模型加速算子适配，为开放共享、面向未来的科学智能基础设施奠定了坚实基础 [3]