物理AI与机器人
搜索文档
英伟达GTC大会全文:黄仁勋宣告推理时代到来,龙虾就是新操作系统
华尔街见闻· 2026-03-17 06:57
公司核心战略与平台优势 - 公司战略围绕三大平台展开:CUDA-X平台、系统平台和全新的AI工厂平台,并强调生态系统的重要性 [1] - 公司是首家垂直整合、同时水平开放的计算公司,通过深入理解应用和算法,为每个垂直领域带来显著加速和成本降低 [9] - 公司拥有庞大的CUDA安装基础,全球有数亿颗运行CUDA的GPU和计算系统,覆盖所有云服务商和计算机厂商,服务于几乎每个行业,这构成了其飞轮效应的基础 [3] - CUDA平台已积累数千种工具、编译器、框架与库,在开源社区有数十万个公开项目,并深度集成至每个主流生态系统 [2] - 庞大的安装基础和持续软件优化使公司架构的计算成本不断下降,同时基础设施拥有极长使用寿命,例如六年前发布的Ampere架构云端定价至今仍在上涨 [3][4] - 公司宣布了与IBM、戴尔、Google Cloud、AWS、Microsoft Azure、CoreWeave、Oracle、Palantir等企业在结构化与非结构化数据平台上的多项重要合作 [11] 技术演进与架构发布 - 今年是CUDA诞生20周年,其基础是革命性的SIMT(单指令多线程)架构,近年来新增了Tiles支持以优化对Tensor Core和AI数学结构的编程 [2] - 公司展示了图形技术的未来——神经渲染(DLSS 5),将可控的3D图形与生成式AI融合,以生成既美观逼真又完全可控的内容 [7] - 公司宣布了下一代架构Vera Rubin,该系统专为Agentic系统设计,采用100%液冷,安装时间从两天缩短至两小时,并使用45°C热水冷却以降低能耗 [19][21] - Vera Rubin系统的核心是全新的Vera CPU,这是全球唯一使用LPDDR5的数据中心CPU,兼具高单线程性能、出色数据处理能力和无与伦比的能效比 [19] - Rubin Ultra采用全新"Kyber"机架,支持144颗GPU构成单一NVLink域,计算节点从正面插入,NVLink交换机从背面连接,构成一台巨型计算机 [22] - 公司发布了技术路线图,包括当前Blackwell(Oberon系统,支持NVLink 72)、Vera Rubin(Kyber机架)、Vera Rubin Ultra以及下一代Feynman架构 [25] - 公司收购了Grok的技术团队并获技术授权,通过开发的Dynamo推理解耦框架,将Grok处理器与Vera Rubin架构耦合,在最具商业价值的服务层级实现性能提升35倍 [22][27] - 全球首款CPO Spectrum-X交换机(共封装光学)已量产,光子直接集成至芯片,该工艺与台积电联合研发 [24] 市场拐点与需求展望 - AI发展经历了从“感知”到“生成”,再到“推理”和“执行”的演进,推理拐点已经到来,AI每次思考、执行、读取、推理都需要进行推断,导致Token生成需求爆炸式增长 [13][14] - 过去两年间,单次工作的计算需求提升了约10,000倍,使用量提升了约100倍,计算总需求的增幅接近100万倍 [14] - 公司对未来的需求展望从去年预测的至2026年约5000亿美元,更新为至少到2027年需求将达到1万亿美元,且确信实际计算需求将远高于此 [15] - 公司业务构成多元化,60%来自五大超大规模云服务商,40%来自区域云、主权云、企业、工业、机器人、边缘和超算等多个领域,这种覆盖本身就是韧性所在 [16] 推理性能与成本优势 - 公司在推理优化上取得根本性突破,从Hopper H200到Grace Blackwell,实际每瓦性能提升达到35倍(有分析指出实际为50倍),远高于摩尔定律预期的约1.5倍 [18] - 极致的性能提升使得公司的每Token成本是全球最低,在吉瓦级数据中心建设成本固定的前提下,安装性能最优的计算系统是实现最低Token成本的关键 [18] - 以Fireworks AI为例,更新软件后,同一套系统的Token速率从约700 tokens/秒提升至近5,000 tokens/秒,提升7倍 [18] - 从Token工厂的商业逻辑看,与Hopper相比,Grace Blackwell在最具商业价值的服务层级,其吞吐量提升了35倍,可将整体数据中心收益提升约5倍 [18] - 在一个吉瓦级AI工厂中,通过架构优化,仅用两年时间Token生成速率将从2200万提升至7亿,提升幅度达350倍 [29] AI工厂与效率提升 - 数据中心正在从存储文件的“数据中心”演变为生产Token的“AI工厂” [40] - 公司创建了英伟达 DSX平台,基于Omniverse,让合作伙伴在虚拟世界中共同设计吉瓦级AI工厂,进行全系统仿真,公司相信该平台能释放约两倍的效率提升 [29] - 公司还将进军太空,Thor芯片已通过辐射认证部署于卫星,并正与合作伙伴开发Vera Rubin Space-1,以在太空中建设数据中心 [29] Agentic AI 与 OpenClaw - OpenClaw成为一个重大新发现,它是一个Agentic系统,能连接大型语言模型、访问工具和文件系统、执行调度、分解任务、生成子Agent并支持多模态交互,本质上是Agentic计算机的操作系统 [30][33] - 企业IT正经历范式转变,旧模式是数据中心存储文件供人类使用软件工具,新模式是每一家SaaS公司都将成为提供专业化Agent服务的AaaS(Agentic as a Service)公司 [30] - 针对企业级Agentic系统的安全挑战,公司与OpenClaw开发者合作,推出了企业级安全的参考架构NemoClaw [31] - 公司宣布成立Nemotron联盟,与BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection、Sarvam、Thinking Machines等公司合作,共同打造Nemotron 4模型,并将NemoClaw等工具深度集成到各自产品中 [34][37] 物理AI、机器人及行业应用 - 公司长期致力于物理AI与机器人领域,为机器人系统打造了三台关键计算机:训练计算机、合成数据生成与仿真计算机、机器人本体内置计算机 [35][38] - 自动驾驶的“ChatGPT时刻”已经到来,公司宣布新增比亚迪、现代、日产、吉利四家RoboTaxi合作伙伴,加上之前的奔驰、丰田、通用,每年合计生产1800万辆汽车将接入其RoboTaxi Ready平台,并与Uber达成重大合作 [35] - 在工业机器人领域,公司与ABB、Universal Robots、KUKA及卡特彼勒等合作,将物理AI模型与仿真系统整合部署至全球制造产线 [35] - 在电信领域,未来的无线基站将演变为英伟达 Aerial AI RAN,能够动态推理流量、自适应调整波束赋形,在提升信号质量的同时显著节省能耗 [35] - 公司展示了与迪士尼联合开发的“奥拉夫”机器人,基于Jetson计算平台和Omniverse训练环境,实现了真实物理世界中的自适应运动 [36] - 公司的生态系统覆盖多个垂直领域,包括自动驾驶、金融服务、医疗健康、工业制造、娱乐与游戏、机器人(110台机器人参展)以及电信(约2万亿美元规模)等 [12] 软件、模型与生态系统更新 - 本届GTC大会上,公司宣布了100个库和约40个模型的更新,这些库是公司的核心资产 [10] - 其中最重要的库之一是cuDNN(CUDA深度神经网络库),它被指出彻底革命性地改变了人工智能,点燃了现代AI的大爆炸 [10] - 公司创建了用于加速结构化数据的数据框(Data Frame)的基础库cuDF,以及用于加速非结构化AI数据的向量存储(Vector Store)的基础库cuVS [9][11] - 公司已在每个AI领域的前沿模型上确立领导地位,包括Nemotron(大型语言模型)、Cosmos(世界基础模型)、GROOT(通用机器人模型)、Alpamayo(自动驾驶)、BioNeMo(数字生物学/药物发现)、PhysicsNeMo(AI物理仿真)等 [34]