Slurm系统
搜索文档
英伟达护城河又宽了,低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它
36氪· 2025-12-17 16:26
文章核心观点 - 英伟达通过收购高性能计算与AI领域的资源调度软件公司SchedMD,旨在将其影响力从硬件层延伸至算力调度层,从而拓宽并巩固其生态系统护城河 [1][6] - 此次收购被视为一项战略举措,即使客户使用AMD或Intel的芯片,只要依赖SchedMD的核心产品Slurm进行算力调度,也将处于英伟达生态的影响范围内 [1][6] - 英伟达同时推出了最新的Nemotron 3系列开源模型,该系列采用MoE架构,旨在以更高效的算力消耗提供强大的模型能力 [13][15] 被收购方:SchedMD公司 - SchedMD成立于2010年,是一家专注于大规模计算任务调度技术的公司 [3] - 公司的核心资产是开源的工作负载管理系统Slurm,该系统能高效分配成千上百台设备的算力资源,服务于AI模型训练、数据预处理、天气预报及基因测序等任务 [4] - 其商业模式基于开源软件Slurm,通过提供专业工程支持、系统维护和定制化开发等增值服务实现盈利 [5] - 客户覆盖范围极广,全球超半数的TOP500超级计算机、科技巨头Meta以及AI创企如Mistral和Thinking Machines均在其服务范围内 [1][5] 收购的战略动机 - 整合成本低:英伟达与SchedMD已有长达十年的合作基础,预计收购后的技术衔接与团队整合成本较低,便于英伟达快速将SchedMD的能力融入自身生态 [6] - 战略价值高:收购使英伟达的影响力从主要绑定自家硬件的CUDA生态,扩展至算力调度层,从而能够辐射使用AMD、Intel等竞争对手芯片的客户群体 [1][6] - 英伟达官方承诺,收购后将保持Slurm的开源和供应商中立属性,确保全球用户正常使用 [9] 潜在挑战与外界关切 - 外界担忧英伟达对部分关键开源项目的持续投入,例如支撑Slurm-on-Kubernetes服务的Slinky项目(涉及slurm-operator、slurm-bridge等关键仓库),英伟达未明确表态会持续开发 [10] - 如果后续开发断档,可能影响相关云服务业务的稳定性,引发业界对英伟达开源承诺能否落到实处的观望 [10][12] 英伟达新产品:Nemotron 3系列模型 - 英伟达推出了采用MoE架构的Nemotron 3系列开源模型,支持百万token上下文窗口 [13] - 系列包含三种规模:Nano(总参数300亿,单次任务激活30亿参数)、Super(总参数1000亿,每token激活100亿参数)、Ultra(总参数5000亿,每token激活500亿参数) [13] - 该设计通过精准控制活跃参数量,在保留大模型核心能力的同时大幅减少算力消耗 [13] - Nano版本已推出,相比前代Nemotron 2 Nano,吞吐量提高4倍,推理成本更低,并被Artificial Analysis评为同类型中最开放、最高效的模型 [15] - Super和Ultra型号预计在2026年上半年推出 [15]
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它
量子位· 2025-12-17 11:38
英伟达收购SchedMD的战略意义 - 公司收购了高性能计算与AI领域的“资源调度王牌管家”SchedMD,其核心资产是开源工作负载管理系统Slurm [1][2] - Slurm系统在全球超半数TOP500超级计算机、科技巨头Meta以及Mistral和Thinking Machines等AI创企中得到广泛应用,行业地位不可替代 [3][9][10] - 该收购被业界评价为“悄悄把自家的护城河拓宽了”,因为即使客户使用AMD或Intel芯片,只要依赖Slurm调度算力,就绕不开英伟达生态的辐射 [3][15] SchedMD公司业务与商业模式 - SchedMD成立于2010年,专注于大规模计算任务调度技术 [5] - 其核心产品Slurm能高效分配成千上百台设备的算力资源,服务于大模型训练、数据预处理、天气预报及基因测序等任务 [6] - 公司商业模式清晰:Slurm免费开源,通过提供专业工程支持、系统维护和定制化开发等增值服务盈利 [8] 英伟达的收购动因 - 整合成本低:双方已有十年合作基础,技术衔接与团队整合成本较低,便于英伟达快速将SchedMD能力融入自身生态 [12][13] - 战略价值高:收购使英伟达的影响力从硬件层延伸至调度层,有助于锁定超算中心、云厂商和AI企业等核心客户群体 [14][15][16] 收购后的承诺与外界关切 - 英伟达官宣收购时承诺,将继续保持Slurm的开源和供应商中立属性,确保全球用户正常使用 [18] - 外界担忧英伟达可能不会持续投入开发支撑新云厂商服务的Slinky项目关键仓库,若后续开发断档可能影响相关业务稳定性 [19][21] 英伟达同期推出的Nemotron 3系列开源模型 - 公司推出了采用MoE架构、支持百万token上下文窗口的Nemotron 3系列开源模型,包括Nano、Super和Ultra三种规模 [22] - Nano模型总参数30B,单次任务激活3B参数;Super总参数100B,每token激活10B参数;Ultra总参数500B,每token激活50B参数 [22] - 该设计通过精准控制活跃参数量,在保留大模型核心能力的同时大幅减少算力消耗 [23] - Nano模型现已推出,相比前代Nemotron 2 Nano,吞吐量提高4倍,推理成本更低,并被Artificial Analysis评为同类型中最开放高效的模型 [25][26][27] - Super和Ultra模型预计于2026年上半年推出 [25]