公司新品发布 - 英伟达在2026年CES展会上首次展示了其Vera Rubin计算平台,该平台旨在加速AI训练速度,让下一代模型提前到来 [1][5] - 公司CEO黄仁勋表示,由于摩尔定律放缓,传统性能提升方式已无法跟上AI模型每年10倍的增长速度,因此英伟达选择了在所有芯片和平台层级上进行极致协同设计的创新路径 [1][5] Vera CPU规格 - Vera CPU具备88个NVIDIA定制Olympus核心,采用空间多线程技术,支持176个线程 [1][5] - 其NVLink C2C带宽为1.8 TB/s,系统内存为1.5TB,是前代Grace的3倍,LPDDR5X带宽为1.2 TB/s [1][5] - 该CPU包含2270亿个晶体管 [1][5] Rubin GPU规格 - Rubin GPU的NVFP4推理算力为50 PFLOPS,是前代Blackwell的5倍 [1][5] - 该GPU拥有3360亿晶体管,比Blackwell晶体管数量增加了1.6倍 [1][5] - 搭载第三代Transformer引擎,能根据Transformer模型需求动态调整精度 [1][5] 配套芯片规格 - ConnectX-9网卡基于200G PAM4 SerDes,支持800 Gb/s以太网,具备可编程RDMA与数据通路加速器,通过了CNSA与FIPS认证,晶体管数量为230亿 [2][6] - BlueField-4 DPU是为新一代AI存储平台构建的端到端引擎,是一款800 Gb/s DPU,搭配ConnectX-9的64核Grace CPU,晶体管数量为1260亿 [2][6] - NVLink-6交换芯片可连接18个计算节点,支持最多72个Rubin GPU协同运行,在NVLink 6架构下,每个GPU可获得3.6 TB/s的all-to-all通信带宽,采用400G SerDes,支持In-Network SHARP Collectives [2][6] - Spectrum-6光以太网交换芯片拥有512通道,每通道200Gbps,集成台积电COOP工艺的硅光子技术,配备共封装光学接口,晶体管数量达到3520亿 [2][6] 系统级性能提升 - 通过6款芯片深度整合,Vera Rubin NVL72系统在NVFP4推理任务中算力达到3.6 EFLOPS,相比上一代Blackwell架构提升5倍 [3][7] - 在NVFP4训练方面,性能达到2.5 EFLOPS,实现3.5倍的性能提升 [3][7] - 系统存储容量方面,配备了54TB的LPDDR5X内存,是前代产品的3倍,HBM容量达到20.7 TB,提升1.5倍 [3][7] - 带宽性能上,HBM4带宽达到1.6 PB/s,提升2.8倍,Scale-Up带宽高达260 TB/s,实现了2倍增长 [3][7]
比Blackwell算力提升5倍!黄仁勋展示Vera Rubin计算平台|直击CES