产品发布与核心定位 - NVIDIA于2026年1月5日在CES上正式推出下一代AI平台Rubin,该平台包含六款新芯片,旨在以最低成本构建、部署和保护全球最大、最先进的AI系统,加速AI主流化进程 [2] - Rubin平台通过六款芯片的极端协同设计,大幅缩短训练时间并降低推理token成本,这六款芯片包括NVIDIA Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太网交换机 [3] - 公司创始人兼CEO黄仁勋表示,Rubin平台在AI训练和推理需求激增的时刻适时推出,凭借每年发布新一代AI超级计算机的节奏和六芯片的极端协同设计,Rubin向AI下一个前沿领域迈出了一大步 [4] 性能突破与技术创新 - 与上一代Blackwell平台相比,Rubin平台将推理token成本降低高达10倍,训练MoE模型所需的GPU数量减少4倍 [5][8] - Rubin平台引入了五项创新技术,包括第六代NVLink互连技术、Transformer Engine、机密计算、RAS Engine以及NVIDIA Vera CPU,这些突破将加速智能体AI、高级推理和大规模专家混合模型推理 [5] - 第六代NVLink技术为大规模MoE模型提供快速无缝的GPU间通信,每个GPU提供3.6TB/s带宽,而Vera Rubin NVL72机架提供260TB/s带宽,超过整个互联网的带宽 [10] - Rubin GPU采用第三代Transformer Engine,具备硬件加速自适应压缩功能,可为AI推理提供50 petaflops的NVFP4计算能力 [20] - Spectrum-X以太网光子共封装光学交换系统为AI应用提供10倍可靠性和5倍正常运行时间,同时实现5倍能效提升 [19] 生态系统与合作伙伴支持 - 全球领先的AI实验室、云服务提供商、计算机制造商和初创公司预计将采用Rubin平台,包括AWS、Anthropic、谷歌、Meta、微软、OpenAI、甲骨文等超过25家行业巨头 [6] - OpenAI CEO Sam Altman表示,智能随算力扩展,Rubin平台有助于持续扩展这一进程,让先进智能惠及所有人 [7] - 微软下一代Fairwater AI超级工厂将采用NVIDIA Vera Rubin NVL72机架级系统,规模将扩展至数十万个NVIDIA Vera Rubin超级芯片 [8] - CoreWeave、AWS、谷歌云、微软和OCI等云提供商将于2026年下半年率先部署基于Vera Rubin的实例 [22] - 思科、戴尔、HPE、联想和超微等公司预计将提供基于Rubin产品的各类服务器 [25] - Anthropic、Meta、Mistral AI、OpenAI、xAI等AI实验室期待利用Rubin平台以更低的延迟和成本训练更强大模型,并服务长上下文、多模态系统 [26] 产品形态与系统设计 - Rubin平台提供两种主要形态:NVIDIA Vera Rubin NVL72机架级解决方案和NVIDIA HGX Rubin NVL8系统 [4] - Vera Rubin NVL72是一个统一的系统,结合了72个Rubin GPU、36个Vera CPU、NVLink 6、ConnectX-9 SuperNIC和BlueField-4 DPU [15] - HGX Rubin NVL8是一个服务器板,通过NVLink连接八个Rubin GPU,支持基于x86的生成式AI平台,加速AI和高性能计算工作负载的训练、推理和科学计算 [16] - NVIDIA DGX SuperPOD可作为大规模部署Rubin系统的参考架构,集成DGX Vera Rubin NVL72或DGX Rubin NVL8系统以及BlueField-4 DPU、ConnectX-9 SuperNIC等组件 [17] 关键组件与新增功能 - NVIDIA Vera CPU专为智能体推理设计,采用88个NVIDIA定制Olympus核心,是大型AI工厂能效最高的CPU [20] - Rubin平台首次在机架级平台提供NVIDIA机密计算,保护全球最大的专有模型及训练和推理工作负载 [20] - 第二代RAS Engine具备实时健康检查、容错和主动维护功能,其模块化无缆托盘设计使组装和维护速度比Blackwell快18倍 [20] - NVIDIA推出全新的AI原生存储基础设施“推理上下文内存存储平台”,由BlueField-4驱动,旨在实现千兆级别的推理上下文扩展 [12] - BlueField-4还引入了高级安全可信资源架构,为AI基础设施构建者提供单一可信控制点,以安全配置、隔离和操作大规模AI环境 [13] 生产与上市时间 - NVIDIA Rubin已进入全面生产阶段,基于Rubin的产品将于2026年下半年通过合作伙伴上市 [22] - CoreWeave将于2026年下半年开始将基于NVIDIA Rubin的系统集成到其AI云平台中 [24]
NVIDIA Kicks Off the Next Generation of AI With Rubin — Six New Chips, One Incredible AI Supercomputer