黄仁勋详解英伟达的AI时代新叙事

GTC 2026 核心发布与战略方向 - 英伟达GTC 2026大会发布多项重磅产品与技术,包括3nm制程的Vera Rubin AI加速平台、集成Groq LPU推理芯片、推出NemoClaw、进军太空计算服务等 [2] - 公司创始人兼CEO黄仁勋在演讲中强调,今年恰逢CUDA推出20周年,其庞大安装量引发的飞轮效应是公司AI算力的核心护城河 [2] - 行业观察指出,英伟达近两年在底层CUDA之上积极开发自身开源大模型,并正从“GPU供应商”彻底转型为“全栈AI基础设施提供商” [2][3] Vera Rubin 平台与 Groq LPU 集成 - Vera Rubin平台已全面投产,正式交付预计在2026年下半年,Blackwell与Rubin架构的综合采购订单预计在2027年前达到1万亿美元规模 [3] - 平台由新一代Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum-6以太网交换机及新集成的Groq 3 LPU共7类芯片协同设计而成,涵盖计算、网络和存储功能 [4] - Groq 3 LPU定位为Rubin GPU的“推理协处理器”,源自公司2025年12月以200亿美元协议收购Groq公司的技术授权,由三星代工并于2026年第三季度出货 [2][5] - 公司通过Dynamo软件系统进行任务分工:将“预填充”阶段交给Vera Rubin处理高吞吐量任务,将对延迟敏感的“解码”阶段交给Groq LPU,官方数据显示每兆瓦功耗的推理吞吐量最高可提升35倍,万亿参数模型的收益机会最高可提升10倍 [5] - Groq LPU大约能覆盖25%的工作负载,主要涉及大量编码或高价值工程级token生成,其余75%由Vera Rubin负责,且集成无需修改现有CUDA软件生态系统 [5][6] 市场影响与竞争格局 - 摩根士丹利研报称,Groq LPU与Vera Rubin的协同设计为AI推理建立了“英伟达标准”,预计到2028年全球AI推理市场规模将达6500亿美元,占AI芯片总市场的70%以上 [3] - 通过结合Rubin GPU和Groq LPU,公司进入了此前由Cerebras、SambaNova等专用推理芯片公司占据的低延迟推理市场,收购Groq技术是对竞争者的直接回应 [6] - Groq 3 LPU的加入可能降低公司此前专为超长上下文推理设计的Rubin CPX GPU的作用,因为LPU无需CPX所需的大量GDDR7内存 [7] 进军CPU直销与系统级扩展 - 公司推出为智能体AI工作负载定制的Vera CPU,这是全球唯一支持LPDDR5的数据中心CPU,并已开始单独销售,有望成为一项数十亿美元级业务,标志着正式进军CPU直销领域 [8][9] - Vera CPU配合BlueField-4 DPU和CX-9 SuperNIC,能够为智能体系统提供工具使用能力,满足智能体调用工具、访问文件系统等需求 [8] - 公司已与Meta达成多年期战略合作,Meta将部署全球首个大规模独立Grace CPU集群 [9] 技术路线图与未来架构 - 展示了Rubin平台的高性能版本Rubin Ultra,采用垂直插入的Kyber机架设计,每个机架能连接144个GPU形成一个NVLink域,芯片即将流片 [10] - 公布了下一代计算架构Feynman,将首次实现铜线与CPO(共封装光学)的共同部署 [10] - 发布了Space-1 Vera Rubin模块,标志着公司正式推出太空计算服务,该模块专为在太空轨道数据中心直接运行LLM和高级基础模型而设计 [10] - 硬件分工从PD分离进一步演化为AFD,即将注意力模块和前馈网络模块部署在不同设备上,以进一步优化资源利用率和推理效率 [10][11] 软件、生态与全栈协同优势 - 黄仁勋提出“AI五层蛋糕理论”,并强调除了芯片层,公司正积极参与上层设计 [12][14] - 盛赞开源项目OpenClaw为“人类历史上最受欢迎的开源项目”之一,重要性堪比Linux和HTML,并推出与之结合的NemoClaw开源项目,定位为“智能体计算机的操作系统” [12] - 推出了包含安全组件OpenShell的NemoClaw参考架构,为企业级应用提供数据隐私和安全保障 [12] - 介绍了六大系列开源模型的最新进展并开放相关资源,包括Nemotron、Cosmos World Foundation Model、Project GR00T、Drive AV Foundation Models、BioNeMo以及Earth-2,以推动整个AI生态发展 [13] - 在自动驾驶领域,宣布“自动驾驶的ChatGPT时刻已经到来”,车辆已具备解释驾驶决策并执行语音指令的推理能力;在机器人领域,正与ABB、Universal Robots、KUKA等企业合作,将物理AI模型与仿真系统结合 [13] - 行业分析认为,公司“硬件+软件+生态”的全栈协同优势短期内无竞争对手可撼动,Vera CPU的独立商业化与OpenClaw的开源策略分别从硬件垂直整合与软件生态开放两个维度巩固了行业地位 [15]