Vera Rubin AI加速平台
搜索文档
英伟达发布Rubin芯片,算力提升五倍,市场万亿美元
新浪科技· 2026-03-17 06:23
产品发布与核心规格 - 英伟达在GTC 2026大会上正式发布Vera Rubin AI加速平台,该平台采用台积电3纳米制程,集成3360亿颗晶体管,较上一代Blackwell的2080亿颗提升超过六成[2] - Vera Rubin是一个六芯协同平台,核心超级芯片包含一颗Vera CPU和两颗Rubin GPU,并搭配NVLink 6交换机、ConnectX-9网卡、BlueField-4 DPU和Spectrum-6以太网交换机,共同构成完整的AI工厂基础设施[3] - Rubin GPU搭载288GB HBM4内存,内存带宽达22TB/秒,其推断算力(FP4精度)高达50 PFLOPS,是Blackwell的5倍,训练算力为35 PFLOPS,超出Blackwell 3.5倍[3] - 整个Vera Rubin NVL72机架配备260TB/秒的NVLink 6带宽,据称已超过整个互联网的带宽总量[3] 性能与效率提升 - 在效率方面,Vera Rubin平台在推断token成本上较Blackwell降低10倍,训练混合专家模型所需GPU数量减少75%[5] - 与Grace Blackwell相比,Vera Rubin每瓦特可交付的性能提升10倍[5] - 全新NVL72机架实现100%液冷和无线缆模块化托盘设计,安装时间从Blackwell时代的2小时压缩至5分钟[5] 未来产品路线图 - 公司展示了下一代产品Rubin Ultra系统,该系统采用Kyber机架架构,竖向集成144颗GPU以提升密度并降低延迟[6] - Rubin Ultra的NVL576配置将在单一机架内整合576颗GPU,FP4推断算力跃升至15 ExaFLOPS,是Rubin NVL144的四倍,内存升级为HBM4e,整机容量达365TB,单机架功耗将达到600千瓦量级[6] - Rubin Ultra预计于2027年下半年量产交付,这维持了公司年度迭代节奏:Blackwell、Blackwell Ultra、Rubin、Rubin Ultra、Feynman将分别于2024至2028年推出[6] 市场订单与客户部署 - Blackwell与Rubin架构的综合采购订单,预计在2027年前达到1万亿美元规模,这是公司去年预测值的两倍[2] - Vera Rubin平台已全面投产,但正式交付要等到2026年下半年[7] - 首批部署客户包括AWS、谷歌云、微软Azure、甲骨文云以及CoreWeave、Lambda等英伟达云合作伙伴[7] - 微软承诺将部署Vera Rubin NVL72机架系统用于其新一代AI数据中心建设,CoreWeave计划从2026年下半年起整合Rubin系统,制造商广达确认初批机器最早可于2026年8月交付[7] 战略布局与生态拓展 - 公司此次GTC的核心叙事是AI从工具向“智能体”的范式转移,并推出与OpenClaw结合的NemoClaw开源项目,定位为“智能体计算机的操作系统”[8] - 公司宣布推进Vera Rubin Space-1计划,目标是在轨道上建设数据中心,其算力相当于H100的25倍[8] - 公司发布了Nvidia Groq 3语言处理单元,这款推断专用芯片预计于今年三季度开始出货,该产品源于公司去年12月以200亿美元完成的对AI芯片初创公司Groq的资产收购[8]