黄仁勋GTC完整演讲:生成Token的成本与效率,决定科技企业的营收与生死
英伟达英伟达(US:NVDA) 虎嗅APP·2026-03-17 22:03

英伟达的战略定位与产业愿景 - 公司正从芯片制造商转型为AI时代的“发电商”,通过全面掌控能源、芯片、基础设施、模型、应用这五层蛋糕,构建统治下一个时代的AI工厂 [2] - AI时代正从单纯的数字生成时代,深化为物理AI大爆炸以及代理式AI全面普及的时代,AI将拥有在三维物理世界中行动与交互的实体能力 [2] - 公司致力于打造全球每Token成本最低的计算方案,因为Token是AI时代新的基础货币,其生成成本与效率直接决定了科技企业的营收 [3] 市场规模与算力需求 - 到2027年,全球计算需求将突破1万亿美元大关 [3] - 过去两年计算需求增长了10000倍,使用量可能增长了100倍,公司相信计算需求在过去两年里增长了一百万倍 [32] - 到2026年,Blackwell和Rubin架构的采购订单总额将达到5000亿美元,而到2027年这一数字将至少达到1万亿美元 [32] 下一代计算架构与平台 - 下一代Vera CPU + Rubin GPU架构专为AI代理系统打造,能在一个系统中连接多达144个GPU,并实现硬件与软件的彻底垂直整合 [5] - 新架构结合液冷技术和封装光学器件,预期能为企业带来高达5倍的营收产出比 [5] - Vera Rubin平台提供3.6 Exaflops算力和每秒260 Terabytes的全对全带宽,算力在10年内提升了4000万倍 [43] - Vera Rubin系统已实现100%液冷,安装时间从两天缩短至两小时,并使用45度温冷却以降低散热成本 [44] 软件生态与CUDA护城河 - CUDA生态诞生20周年,已在全球累积数亿GPU的装机量,渗透进每一个技术生态 [6][12] - 庞大的CUDA装机量是推动飞轮效应的核心动力,吸引了开发者并催生了新市场 [12] - 公司发布了用于结构化数据处理的cuDF和用于非结构化AI数据的cuVS两个基础库 [16] - 公司正在研发下一代图形技术DLSS 5.0,这是3D图形与人工智能(神经渲染)的融合 [15] 代理式AI与操作系统 - 公司推出了NemoClaw参考堆栈,相当于为代理式计算机打造了一个专用的操作系统底座,让开发者能快速构建、部署和加速个性化AI Agent [7] - OpenClaw成为人类历史上最受欢迎的开源项目,它是一个超级连接器和全局化的智能体系统,本质上是一个操作系统 [69][71] - 公司宣布全力支持OpenClaw生态,并推出了具备企业级安全和隐私保护能力的NemoClaw参考实现 [69][74] 物理AI与机器人技术 - 公司强调物理AI的概念,AI必须学会理解重力、摩擦力以及复杂的三维物理空间 [8] - 在自动驾驶领域,比亚迪、现代、日产等头部车企已加入公司的Robotaxi就绪平台 [8] - 公司发布了专为人形机器人打造的通用基础模型Project GR00T,并大幅更新了Isaac机器人平台 [8] - 自动驾驶汽车的ChatGPT时刻已经到来,公司自动驾驶出租车平台新增四位合作伙伴,其年产量达1800万辆 [80] 垂直整合与横向开放 - 公司是一家垂直整合但同时横向开放的公司,深入理解各垂直行业和领域,并开发相应的库 [26][27] - 通过将软件、库和技术与合作伙伴的技术结合,集成到任何目标平台,将加速计算带给世界上的每一个人 [27] - 公司拥有触达各大垂直领域的领域特定库,例如金融服务、医疗保健、工业、量子计算等 [27][28] 推理之年与Token经济学 - 2025年是公司的推理之年,致力于在AI的每一个阶段都表现出色 [35] - 公司60%的业务来自前五大超大规模云服务商,另外40%的业务遍布区域云、主权云、企业、工业等领域 [35][36] - Token正在成为一种新的大宗商品,市场将出现细分,从免费层级到每百万Token收费150美元的高级模型服务 [45][46] - 在给定的功率下,AI工厂的吞吐量和Token生成速度将直接决定明年的收入 [44] 收购与架构整合 - 公司收购了Groq芯片研发团队并获得技术授权,以打破同时兼顾高吞吐量与极低延迟的物理瓶颈 [52] - 通过名为Dynamo的软件实现解耦推理,将高吞吐量计算任务交给Vera Rubin,将解码生成等负载卸载给Groq [54] - 整合Groq技术的新一代Vera Rubin系统实现了高达35倍的性能飞跃 [55] 产品路线图与未来架构 - 公司正以每年一次的极速节奏推进架构迭代,从芯片公司蜕变为提供AI工厂和基础设施的系统级公司 [64] - 下一代Rubin Ultra芯片正在流片中,将首发搭载革命性的NVFP4计算架构 [61] - 之后将迎来代号为Feynman的全新一代架构,拥有全面革新的GPU和由公司与Grok团队打造的全新LPU——LP40芯片 [62] AI工厂设计与运营 - 公司打造了Omniverse及其延伸的DSX平台,这是一个用于联合设计吉瓦级超级AI工厂的数字孪生平台 [64] - DSX平台能直接与现实世界的电网连接,动态统筹调度数据中心功耗以节约能源,并引入Max-Q技术进行动态负载均衡 [64] - 公司计划在太空中建设数据中心,正研发名为Vera Rubin Space One的新型计算机 [66] 开放模型与主权AI - 公司处于每一个AI模型领域的最前沿,拥有涵盖语言、视觉、生物学、物理学等领域的近三百万个开放模型 [74][75] - 公司宣布成立Nemotron联盟,致力于开发更出色的基础模型,以帮助每个国家建立其主权AI [76] - 公司的开放模型为研究人员和开发人员提供了构建其专业领域AI的基础,模型在多个领域位列排行榜第一 [75][76]