下载量超 1300 万,昇思 MindSpore:AI 框架迈入“超节点时代”
AI前线·2025-12-30 13:32

昇思MindSpore社区发展成果 - 开源五周年之际,昇思MindSpore社区取得高速增长,累积下载量超过1300万,社区核心贡献开发者超过5.2万人,代码核入量超过12万,拥有全球150多个国家和地区用户,联合超过两千多家社区孵化3100多个行业应用 [2] - 社区已形成清晰定位,专注AI框架本身,与训练推理加速库、模型社区、评测与工具社区协同发展,支持超过二十五类模型,覆盖从脚本开发、并行训练、效果微调到部署的全流程开箱即用能力 [3] - 在大模型推理场景中,MindSpore已实现对vLLM社区能力的全面对接,在一体机等关键场景下,无需修改代码即可通过编译加速获得超过15%的性能提升 [3] AI框架技术演进与MindSpore新架构 - 随着大语言模型兴起,模型规模跃迁至百亿、千亿甚至万亿级,计算形态转向集群,模型并行、序列并行、专家并行等方式应运而生 [4] - 全模态模型与Agentic AI的兴起,以及算力底座向超节点架构演进,正在推动AI框架迈向新的架构范式,新范式主要面临模型序列长度增长带来的存储压力、全模态模型结构不规则化带来的并行与优化复杂度、以及Agentic RL等新训推范式对多任务异构调度的要求三方面挑战 [4] - MindSpore与超节点硬件深度协同,提出HyperParallel架构,将超节点视为一台超级计算机进行统一编程与调度,并引入Hyperoffload等关键技术 [4] - Hyperoffload通过计算与状态分离,将权重、激活与优化器状态卸载到外部内存池,实际效果显示训练性能可提升约20%,推理场景下可支持的序列长度提升约七成 [4] - HyperMPMD引入多维MPMD并行,在子模型内、子模型间以及跨模态跨任务三个维度提升通算掩盖率与资源利用率,使整体集群算力利用率提升约15% [11] - Hypershard提供声明式并行编程范式,实现算法与并行策略解耦,使新算法的并行化改造时间缩短至一天以内,并行调优从天级降至小时级 [11] - 昇思HyperParallel架构充分发挥超节点架构优势,实现HyperShard声明式并行编程、HyperMPMD异构非规则并行、HyperOffload多级智能卸载等特性,加速Agentic AI、全模态等新模型结构和训推范式创新 [6] - 超节点亲和的HyperParallel架构正式版本及配套的全模态与强化学习加速套件将于明年上半年发布 [7] MindSpore的技术能力与生态覆盖 - 在大模型领域,MindSpore已原生支持超大规模集群并行,可覆盖数万个计算节点,支持万亿级参数规模的一站式并行策略搜索与执行优化 [5] - 在部署层面,MindSpore打通了端、边、云全场景能力,从数据中心服务器集群到耳机、手表等小型终端设备均可提供完整的训练与推理能力,目前已应用于从服务器到数亿台终端设备的广泛场景中 [5] - 在科学计算方向,MindSpore原生支持NumPy、SciPy等接口加速,并通过函数式自动微分能力帮助科研人员探索AI for Science应用 [5] - 未来MindSpore社区还将在端侧智能、架构开放以及行业使能等方向持续推进,覆盖端侧大模型与Agent加速、核心能力模块化开放,以及面向AI for Science与行业迁移的工具体系建设 [7]