黄仁勋 2026 GTC 演讲全解析

文章核心观点 - NVIDIA在GTC大会上宣示其战略，正从芯片公司转型为基础设施级计算公司，通过全栈五层架构（战略能源、芯片、基础设施、模型、应用）重塑全球AI工厂 [1][2][4] - 公司将“Token”定义为AI时代的基本单位，数据中心正从文件中心转变为“Token工厂”，算力即收入，未来所有公司都将关注Token工厂的效率 [1][22] CUDA生态与护城河 - CUDA是NVIDIA的核心，公司专注其发展已20年，其单指令多线程（SIMT）架构极大简化了多线程应用开发 [5] - 围绕CUDA建立了庞大的生态系统，包括成千上万的开源工具、编译器、框架和库，公共项目多达数十万，覆盖全球数亿GPU和计算系统 [7] - CUDA庞大的装机量形成了飞轮效应：吸引开发者、催生新算法、推动深度学习突破、创造新市场，最终使飞轮加速 [7] - 公司库的下载量正以空前的速度和规模增长，软件的持续优化让用户长期成本下降，这也是6年前发布的Ampere系列在云端价格反而上涨的原因 [7] - GeForce是公司历史上最成功的营销活动，为CUDA走向世界奠定了基础，并让AI先驱（如Alex Krushevsky, Ilya Sutskever等）发现GPU能加速深度学习 [9][11] 数据处理革命：cuDF与cuVS - NVIDIA推出cuDF与cuVS两大基础库，分别用于处理结构化数据帧和向量存储/语义数据，旨在成为未来最重要的数据处理平台之一 [12][14] - cuDF加速结构化数据处理，让企业计算基石（如SQL, Spark, Pandas等处理的数据帧）能被AI高速使用 [14] - 世界上90%以上新生成的数据是非结构化的，AI能解决其多模态感知和理解问题，cuVS用于处理此类数据 [14] - 实际应用效果显著：雀巢使用GPU加速的Watson X.data处理全球订单数据，速度提升5倍，成本降低83% [16] - Snapchat与Google Cloud合作采用加速数据处理后，计算成本降低了近80%（官方精确数据为76%） [16] 算力跃迁与推理时代 - 过去两年算力需求激增，黄仁勋估算增长了百万倍，主要因生成式AI（如ChatGPT）、推理AI（赋予AI反思规划能力）及AI助手（如Codex, Cursor）三大节点推动 [18][21] - 推理时代来临，计算量提高约1万倍，结合使用量增长约100倍，导致算力需求百万倍增长 [21] - 从Hopper架构到Grace Blackwell架构，一代之间AI推理性能飙升35倍，NVIDIA的Token成本全球最低 [22] - 黄仁勋去年预测2026年前Blackwell和Rubin系统需求订单达5000亿美元，现预测到2027年需求将至少达到1万亿美元 [21] - 为应对需求，公司推出新一代Vera Rubin平台，这是一个专为代理AI设计的垂直整合完整系统 [24] - Vera Rubin NVLink 72拥有3.6 ExaFLOPS计算力和260TB/s全互联带宽，其CPU是全球唯一采用LPDDR5的高性能数据中心CPU [24] - Vera Rubin系统100%液冷，安装时间从2天缩短至2小时，采用45度热水冷却以降低数据中心冷却成本 [25] - 公司拥有全球唯一第六代规模扩展交换系统NVLink，以及世界首款CPO (Co-Packaged Optics) Spectrum X交换机 [25] Agent时代与软件生态 - AI原生企业过去两年爆发式增长，风险投资达1500亿美元，是人类历史最大规模，这些企业急需大量算力和Token [28] - OpenClaw成为人类历史上最受欢迎的开源项目，几周内超越了Linux 30年的成就，被比作“代理计算机的操作系统” [28] - 企业IT形态将彻底改变，未来每家SaaS公司都将变成Agent-as-a-Service（代理即服务）公司 [30] - NVIDIA推出企业级参考设计NeMo Claw，内置网络护栏和隐私路由，确保代理在企业内安全执行 [30] - 黄仁勋预言未来每位工程师年初都会获得一定的Token预算，拥有Token的工程师将实现10倍的产能提升，未来所有软件公司都是代理公司 [31] - NVIDIA发布了六大系列前沿模型，核心是Nemotron系列，并宣布成立Nemotron联盟以打造更强大的Nemotron 4 [34] - 在AI推理评估中，NVIDIA的Nemotron 3 Super模型表现优异，在榜单中排名前列 [31] 具身智能与自动驾驶 - 黄仁勋宣布自动驾驶的“ChatGPT时刻”已经到来，自动驾驶汽车配备的NVIDIA Alpamayo能够进行推理、智能操作并执行语音指令 [33] - 为弥合真实世界数据鸿沟，公司打造了开源的Isaac Lab用于机器人训练、评估和仿真，以及Cosmos World Models、GR00T基础模型和Newton物理求解器 [36] - 全球开发者正利用NVIDIA的算力和仿真平台加速物理AI落地，展会现场展示了110台机器人 [36] 生态系统与合作伙伴 - NVIDIA构建了庞大且深度的生态系统，业务数据显示60%的需求来自五大超级云服务商，剩余40%涵盖区域云、主权云、企业、工业、机器人等 [37] - 全球头部云厂商（AWS, Azure, Google Cloud, Oracle）及戴尔、IBM等行业巨头已100%接入NVIDIA系统 [10][45] - AWS：NVIDIA将把OpenAI带到AWS，并深度整合以加速其EMR、SageMaker、Bedrock等服务 [38] - 微软Azure：NVIDIA打造了全球首台超级计算机并首个安装在Azure上，支持AI Foundry并加速Bing搜索，是全球首批支持保密计算的厂商 [40] - Google Cloud：NVIDIA深度加速其Vertex AI和BigQuery平台 [42] - Oracle：NVIDIA是Oracle的首个AI客户，并为其带来了Cohere、Fireworks和OpenAI等合作伙伴 [43] - 与CoreWeave合作打造了全球首个AI原生云公司，专注GPU托管 [44] - 企业巨头如IBM利用cuDF加速Watson X，戴尔打造了整合cuDF和cuVS的AI数据平台 [45] - 出行与机器人领域：比亚迪、吉利、五十铃、日产加入RoboTaxi Ready平台，与Uber达成重要合作部署自动驾驶出租车，ABB、KUKA等机器人公司将物理AI模型集成进仿真系统 [45] - 全球存储行业100%加入了NVIDIA系统 [45] 向基础设施公司转型：AI工厂与数字孪生 - NVIDIA正从一家芯片公司转型为工厂级、基础设施级计算公司，全球最大规模的基础设施建设正在进行 [46] - 为确保AI工厂设计最优、实现最大Token吞吐和能效，公司推出了Omniverse DSX平台，这是一个数字孪生蓝图 [46] - DSX平台包含多个API连接：DSX Sim（物理、电、热和网络仿真）、DSX Exchange（管理运营数据）、DSX Flex（电网动态功率管理）、DSX MaxQ（动态最大化Token吞吐） [46] - 工厂上线后，数字孪生即为运营者，AI代理（如Phaedra代理监控冷却和电力，Emerald AI代理解析电网负载）协同DSX MaxQ动态管理基础设施，确保没有功率被浪费，黄仁勋坚信还有2倍的提升空间 [46] - Omniverse旨在承载全球数字孪生，从地球开始，未来覆盖各种规模，公司计算机（Thor）已部署到卫星上，未来还将建设太空数据中心 [47]