英伟达Rubin架构新品发布 - 2026年将是英伟达史无前例的支出大年,公司正力证自身在AI领域的绝对实力和领先优势 [2] - 在CES 2026上,英伟达CEO黄仁勋宣布新一代Rubin架构已实现全面投产,时间节点大幅早于市场此前预期的2026年下半年 [3] - Rubin平台整体架构由六颗芯片构成,包括Vera CPU、Rubin GPU、NVLink™6交换机、ConnectX-9® SuperNIC、BlueField-4® DPU和Spectrum-6™以太网交换机 [3] Rubin架构的性能与成本优势 - 相比于目前的Blackwell架构,Rubin通过使用4倍的GPU并行训练混合专家模型,使每个token的平均推理成本降低多达10倍 [4] - 大模型训练速度提高至3.5倍,能源使用效率大幅提升,每瓦特电力的推理能力提升8倍 [4] - 公司强调Rubin在性价比上的优势,旨在以最低成本加速主流AI的应用和普及 [4] - 公司CEO表示,其产品能帮助客户大幅改善总拥有成本,这是其每推出一代产品都能提升在数据中心份额的根本原因 [5] 市场竞争与客户需求 - 以谷歌TPU为代表的ASIC芯片正强势冲击英伟达GPU在AI芯片领域一家独大的地位,其优势之一是以更低的总拥有成本打造性能更优的大模型 [5] - 摩根大通预计,2026年数据中心AI芯片总出货量将同比增长26%至1292万颗,但ASIC芯片约43%的增速会明显高于GPU约15%的增速,ASIC市占比将从不到41%提升到超过46% [6] - 大多数主流云厂商、大模型厂商、人工智能实验室和计算机制造商都有意部署Rubin,包括AWS、谷歌、微软、Meta、甲骨文、OpenAI、Anthropic、xAI等 [5] - 在美国出口限制下,中国的云厂商和大模型开发者尚无法直接在本地部署Blackwell和Rubin [5] 英伟达对AI未来发展的布局 - 公司CEO认为人工智能将从生成式AI走向能够自主行动的代理AI,最终向能在现实世界行动的物理AI演进,并看好2026年进入“代理AI”阶段 [6] - 在物理AI方面,公司发布了多个机器人、自动驾驶领域的新品,包括首个实现自主思考与推理的自动驾驶模型Alpamayo、最新的Cosmos模型和GR00T开放模型及数据 [6] - 波士顿动力、卡特彼勒、Franka Robotics、LG电子等全球领先企业正在利用英伟达的机器人技术栈打造新的AI机器人 [7] - 公司CEO宣称,物理AI的“ChatGPT时刻”已经到来 [7]
黄仁勋:Rubin提前量产,物理AI“ChatGPT时刻”已至