Vera Rubin AI加速平台 - 财报，业绩电话会，研报，新闻

Vera Rubin AI加速平台

搜索文档

新浪科技· 2026-03-17 06:23

产品发布与核心规格 - 英伟达在GTC 2026大会上正式发布Vera Rubin AI加速平台，该平台采用台积电3纳米制程，集成3360亿颗晶体管，较上一代Blackwell的2080亿颗提升超过六成[2] - Vera Rubin是一个六芯协同平台，核心超级芯片包含一颗Vera CPU和两颗Rubin GPU，并搭配NVLink 6交换机、ConnectX-9网卡、BlueField-4 DPU和Spectrum-6以太网交换机，共同构成完整的AI工厂基础设施[3] - Rubin GPU搭载288GB HBM4内存，内存带宽达22TB/秒，其推断算力（FP4精度）高达50 PFLOPS，是Blackwell的5倍，训练算力为35 PFLOPS，超出Blackwell 3.5倍[3] - 整个Vera Rubin NVL72机架配备260TB/秒的NVLink 6带宽，据称已超过整个互联网的带宽总量[3] 性能与效率提升 - 在效率方面，Vera Rubin平台在推断token成本上较Blackwell降低10倍，训练混合专家模型所需GPU数量减少75%[5] - 与Grace Blackwell相比，Vera Rubin每瓦特可交付的性能提升10倍[5] - 全新NVL72机架实现100%液冷和无线缆模块化托盘设计，安装时间从Blackwell时代的2小时压缩至5分钟[5] 未来产品路线图 - 公司展示了下一代产品Rubin Ultra系统，该系统采用Kyber机架架构，竖向集成144颗GPU以提升密度并降低延迟[6] - Rubin Ultra的NVL576配置将在单一机架内整合576颗GPU，FP4推断算力跃升至15 ExaFLOPS，是Rubin NVL144的四倍，内存升级为HBM4e，整机容量达365TB，单机架功耗将达到600千瓦量级[6] - Rubin Ultra预计于2027年下半年量产交付，这维持了公司年度迭代节奏：Blackwell、Blackwell Ultra、Rubin、Rubin Ultra、Feynman将分别于2024至2028年推出[6] 市场订单与客户部署 - Blackwell与Rubin架构的综合采购订单，预计在2027年前达到1万亿美元规模，这是公司去年预测值的两倍[2] - Vera Rubin平台已全面投产，但正式交付要等到2026年下半年[7] - 首批部署客户包括AWS、谷歌云、微软Azure、甲骨文云以及CoreWeave、Lambda等英伟达云合作伙伴[7] - 微软承诺将部署Vera Rubin NVL72机架系统用于其新一代AI数据中心建设，CoreWeave计划从2026年下半年起整合Rubin系统，制造商广达确认初批机器最早可于2026年8月交付[7] 战略布局与生态拓展 - 公司此次GTC的核心叙事是AI从工具向“智能体”的范式转移，并推出与OpenClaw结合的NemoClaw开源项目，定位为“智能体计算机的操作系统”[8] - 公司宣布推进Vera Rubin Space-1计划，目标是在轨道上建设数据中心，其算力相当于H100的25倍[8] - 公司发布了Nvidia Groq 3语言处理单元，这款推断专用芯片预计于今年三季度开始出货，该产品源于公司去年12月以200亿美元完成的对AI芯片初创公司Groq的资产收购[8]

Nvidia Groq 3语言处理单元（LPU）

Nvidia Groq 3语言处理单元（LPU）