英伟达发布新一代Rubin平台,推理成本较Blackwell降10倍,已全面投产拟下半年发货
英伟达英伟达(US:NVDA) 硬AI·2026-01-06 09:40

产品发布与核心性能 - 英伟达在CES展会推出新一代Rubin AI平台,标志着其在人工智能芯片领域保持年度更新节奏,该平台将于2026年下半年交付首批客户 [3] - Rubin平台的训练性能是前代Blackwell的3.5倍,运行AI软件的性能则提升5倍 [2][7] - 与Blackwell平台相比,Rubin可将推理token生成成本降低至多10倍,训练混合专家模型所需GPU数量减少4倍 [2][7] - 新平台配备的Vera CPU拥有88个核心,性能是其替代产品的两倍,是大规模AI工厂中能效最高的处理器 [8] - Rubin GPU配备第三代Transformer引擎,可提供50 petaflops的NVFP4计算能力用于AI推理,每个GPU提供3.6TB/s的带宽 [8] - Vera Rubin NVL72机架则提供260TB/s带宽 [8] 技术进展与创新 - 全部六款Rubin芯片已从制造合作伙伴处返回,并已通过显示其可按计划部署的关键测试 [2][5][10] - 该平台包含五大创新技术:第六代NVLink互连技术、Transformer引擎、机密计算、RAS引擎以及Vera CPU [10] - 第三代机密计算技术使Vera Rubin NVL72成为首个提供跨CPU、GPU和NVLink域数据安全保护的机架级平台 [10] - 第二代RAS引擎具备实时健康检查、容错和主动维护功能,以最大化系统生产力 [10] - 机架采用模块化、无线缆托盘设计,组装和维护速度比Blackwell快18倍 [10] 生态系统与客户部署 - 亚马逊AWS、谷歌云、微软和甲骨文云等云服务商将率先部署,云合作伙伴CoreWeave、Lambda、Nebius和Nscale也将跟进 [2][12] - 微软的下一代Fairwater AI超级工厂将配备英伟达Vera Rubin NVL72机架级系统,规模可扩展至数十万颗英伟达Vera Rubin超级芯片 [5] - 包括Anthropic、Cohere、Meta、Mistral AI、OpenAI和xAI等AI实验室正期待利用Rubin平台训练更大型、更强大的模型 [13] - 思科、戴尔、惠普企业、联想和超微预计将推出基于Rubin产品的各类服务器 [13] - OpenAI CEO Sam Altman表示英伟达Rubin平台帮助其持续扩展计算进展 [12] - Anthropic联合创始人兼CEO Dario Amodei称Rubin平台的效率提升代表了能够实现更长记忆、更好推理和更可靠输出的基础设施进步 [12] - Meta CEO扎克伯格表示Rubin平台有望带来性能和效率的阶跃式变化,这是将最先进模型部署给数十亿人所需要的 [13] 市场背景与战略意义 - 基于Rubin的系统运行成本将低于Blackwell版本,因为它们用更少组件即可实现相同结果 [5] - 该平台的推出正值华尔街部分人士担忧英伟达面临竞争加剧,并怀疑AI领域的支出能否维持当前速度 [5] - 英伟达保持长期看涨预测,认为总市场规模可达数万亿美元 [5] - 公司今年比往年更早披露新产品的细节,这是其保持行业依赖其硬件的举措之一 [15] - 英伟达正在推动面向整个经济领域的AI应用,包括机器人、医疗保健和重工业,并宣布了一系列旨在加速自动驾驶汽车和机器人开发的工具 [15]

英伟达发布新一代Rubin平台,推理成本较Blackwell降10倍,已全面投产拟下半年发货 - Reportify