MOE)模型
搜索文档
跻身英伟达Rubin首批云服务商:Nebius(NBIS.US)将于2026下半年上线Vera Rubin NVL72算力集群
智通财经· 2026-01-06 21:41
公司战略与产品部署 - Nebius公司计划从2026年下半年开始,在美国和欧洲提供英伟达的Vera Rubin NVL72图形处理器(GPU) [1] - 公司将通过其Nebius AI云和Nebius Token Factory(一个面向企业的推理及训练后平台)部署英伟达Rubin平台,并成为首批提供该计算平台的AI云供应商之一 [1] - 公司将把Vera Rubin NVL72集成到其位于美国和欧洲数据中心的全栈基础设施中,旨在使客户能够构建具有区域可用性和可控性的下一代AI应用程序 [1] - 公司创始人兼首席执行官表示,此举旨在为AI创新者和企业提供基础设施,帮助他们更快、更高效地开发代理式和推理式AI系统 [1] - Rubin加速计算平台将与公司现有的英伟达GB200 NVL72和英伟达Grace Blackwell Ultra NVL72产能形成互补,以扩大客户对平台的选择范围 [2] 行业技术进展与产品规格 - 英伟达首席执行官指出,作为Grace Blackwell的继任者,下一代计算平台Vera Rubin目前已进入全面量产阶段 [2] - 英伟达高管将Vera Rubin平台描述为“六颗芯片构成的一台AI超级计算机”,其核心组件包括Vera CPU、Rubin GPU、第六代NVLink交换芯片、ConnectX-9网卡、BlueField4 DPU以及Spectrum-X102.4T CPO [2] - 该平台面向云端与大型数据中心的下一代AI工作负载 [2] - Rubin GPU芯片搭载第三代Transformer引擎,其NVFP4推理算力为50 PFLOPS,是英伟达上一代Blackwell GPU的5倍 [3] - 在整体架构层面,Vera Rubin平台在相同训练时间内可完成超大规模“专家混合”(Mixture of Experts,MOE)模型的训练,却只需原来四分之一数量的GPU,且每个token的训练成本降至原来的七分之一 [3] - 英伟达强调,Vera Rubin将支持第三代机密计算技术,并将成为业界首个机架级可信计算平台,面向对安全隔离、数据隐私与多租户环境有高要求的AI场景 [3]