物理AI与机器人 - 财报，业绩电话会，研报，新闻

物理AI与机器人

搜索文档

华尔街见闻· 2026-03-17 06:57

公司核心战略与平台优势 - 公司战略围绕三大平台展开：CUDA-X平台、系统平台和全新的AI工厂平台，并强调生态系统的重要性 [1] - 公司是首家垂直整合、同时水平开放的计算公司，通过深入理解应用和算法，为每个垂直领域带来显著加速和成本降低 [9] - 公司拥有庞大的CUDA安装基础，全球有数亿颗运行CUDA的GPU和计算系统，覆盖所有云服务商和计算机厂商，服务于几乎每个行业，这构成了其飞轮效应的基础 [3] - CUDA平台已积累数千种工具、编译器、框架与库，在开源社区有数十万个公开项目，并深度集成至每个主流生态系统 [2] - 庞大的安装基础和持续软件优化使公司架构的计算成本不断下降，同时基础设施拥有极长使用寿命，例如六年前发布的Ampere架构云端定价至今仍在上涨 [3][4] - 公司宣布了与IBM、戴尔、Google Cloud、AWS、Microsoft Azure、CoreWeave、Oracle、Palantir等企业在结构化与非结构化数据平台上的多项重要合作 [11] 技术演进与架构发布 - 今年是CUDA诞生20周年，其基础是革命性的SIMT（单指令多线程）架构，近年来新增了Tiles支持以优化对Tensor Core和AI数学结构的编程 [2] - 公司展示了图形技术的未来——神经渲染（DLSS 5），将可控的3D图形与生成式AI融合，以生成既美观逼真又完全可控的内容 [7] - 公司宣布了下一代架构Vera Rubin，该系统专为Agentic系统设计，采用100%液冷，安装时间从两天缩短至两小时，并使用45°C热水冷却以降低能耗 [19][21] - Vera Rubin系统的核心是全新的Vera CPU，这是全球唯一使用LPDDR5的数据中心CPU，兼具高单线程性能、出色数据处理能力和无与伦比的能效比 [19] - Rubin Ultra采用全新"Kyber"机架，支持144颗GPU构成单一NVLink域，计算节点从正面插入，NVLink交换机从背面连接，构成一台巨型计算机 [22] - 公司发布了技术路线图，包括当前Blackwell（Oberon系统，支持NVLink 72）、Vera Rubin（Kyber机架）、Vera Rubin Ultra以及下一代Feynman架构 [25] - 公司收购了Grok的技术团队并获技术授权，通过开发的Dynamo推理解耦框架，将Grok处理器与Vera Rubin架构耦合，在最具商业价值的服务层级实现性能提升35倍 [22][27] - 全球首款CPO Spectrum-X交换机（共封装光学）已量产，光子直接集成至芯片，该工艺与台积电联合研发 [24] 市场拐点与需求展望 - AI发展经历了从“感知”到“生成”，再到“推理”和“执行”的演进，推理拐点已经到来，AI每次思考、执行、读取、推理都需要进行推断，导致Token生成需求爆炸式增长 [13][14] - 过去两年间，单次工作的计算需求提升了约10,000倍，使用量提升了约100倍，计算总需求的增幅接近100万倍 [14] - 公司对未来的需求展望从去年预测的至2026年约5000亿美元，更新为至少到2027年需求将达到1万亿美元，且确信实际计算需求将远高于此 [15] - 公司业务构成多元化，60%来自五大超大规模云服务商，40%来自区域云、主权云、企业、工业、机器人、边缘和超算等多个领域，这种覆盖本身就是韧性所在 [16] 推理性能与成本优势 - 公司在推理优化上取得根本性突破，从Hopper H200到Grace Blackwell，实际每瓦性能提升达到35倍（有分析指出实际为50倍），远高于摩尔定律预期的约1.5倍 [18] - 极致的性能提升使得公司的每Token成本是全球最低，在吉瓦级数据中心建设成本固定的前提下，安装性能最优的计算系统是实现最低Token成本的关键 [18] - 以Fireworks AI为例，更新软件后，同一套系统的Token速率从约700 tokens/秒提升至近5,000 tokens/秒，提升7倍 [18] - 从Token工厂的商业逻辑看，与Hopper相比，Grace Blackwell在最具商业价值的服务层级，其吞吐量提升了35倍，可将整体数据中心收益提升约5倍 [18] - 在一个吉瓦级AI工厂中，通过架构优化，仅用两年时间Token生成速率将从2200万提升至7亿，提升幅度达350倍 [29] AI工厂与效率提升 - 数据中心正在从存储文件的“数据中心”演变为生产Token的“AI工厂” [40] - 公司创建了英伟达 DSX平台，基于Omniverse，让合作伙伴在虚拟世界中共同设计吉瓦级AI工厂，进行全系统仿真，公司相信该平台能释放约两倍的效率提升 [29] - 公司还将进军太空，Thor芯片已通过辐射认证部署于卫星，并正与合作伙伴开发Vera Rubin Space-1，以在太空中建设数据中心 [29] Agentic AI 与 OpenClaw - OpenClaw成为一个重大新发现，它是一个Agentic系统，能连接大型语言模型、访问工具和文件系统、执行调度、分解任务、生成子Agent并支持多模态交互，本质上是Agentic计算机的操作系统 [30][33] - 企业IT正经历范式转变，旧模式是数据中心存储文件供人类使用软件工具，新模式是每一家SaaS公司都将成为提供专业化Agent服务的AaaS（Agentic as a Service）公司 [30] - 针对企业级Agentic系统的安全挑战，公司与OpenClaw开发者合作，推出了企业级安全的参考架构NemoClaw [31] - 公司宣布成立Nemotron联盟，与BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection、Sarvam、Thinking Machines等公司合作，共同打造Nemotron 4模型，并将NemoClaw等工具深度集成到各自产品中 [34][37] 物理AI、机器人及行业应用 - 公司长期致力于物理AI与机器人领域，为机器人系统打造了三台关键计算机：训练计算机、合成数据生成与仿真计算机、机器人本体内置计算机 [35][38] - 自动驾驶的“ChatGPT时刻”已经到来，公司宣布新增比亚迪、现代、日产、吉利四家RoboTaxi合作伙伴，加上之前的奔驰、丰田、通用，每年合计生产1800万辆汽车将接入其RoboTaxi Ready平台，并与Uber达成重大合作 [35] - 在工业机器人领域，公司与ABB、Universal Robots、KUKA及卡特彼勒等合作，将物理AI模型与仿真系统整合部署至全球制造产线 [35] - 在电信领域，未来的无线基站将演变为英伟达 Aerial AI RAN，能够动态推理流量、自适应调整波束赋形，在提升信号质量的同时显著节省能耗 [35] - 公司展示了与迪士尼联合开发的“奥拉夫”机器人，基于Jetson计算平台和Omniverse训练环境，实现了真实物理世界中的自适应运动 [36] - 公司的生态系统覆盖多个垂直领域，包括自动驾驶、金融服务、医疗健康、工业制造、娱乐与游戏、机器人（110台机器人参展）以及电信（约2万亿美元规模）等 [12] 软件、模型与生态系统更新 - 本届GTC大会上，公司宣布了100个库和约40个模型的更新，这些库是公司的核心资产 [10] - 其中最重要的库之一是cuDNN（CUDA深度神经网络库），它被指出彻底革命性地改变了人工智能，点燃了现代AI的大爆炸 [10] - 公司创建了用于加速结构化数据的数据框（Data Frame）的基础库cuDF，以及用于加速非结构化AI数据的向量存储（Vector Store）的基础库cuVS [9][11] - 公司已在每个AI领域的前沿模型上确立领导地位，包括Nemotron（大型语言模型）、Cosmos（世界基础模型）、GROOT（通用机器人模型）、Alpamayo（自动驾驶）、BioNeMo（数字生物学/药物发现）、PhysicsNeMo（AI物理仿真）等 [34]