对话英伟达业务副总裁：机器人的“ChatGPT时刻”正在到来

公司战略定位与业务扩展 - 公司业务范围显著扩充，从以GPU闻名转变为一家包揽AI基础设施或AI工厂多个环节的厂商，产品涵盖数据中心加速器、机架、网络产品和多款开源模型 [1] - 在以大型云厂商为客户的60%业务之外，公司正积极拓展其余40%的业务，物理AI中的自动驾驶和机器人成为两个重要抓手，不仅提供硬件，还开发自动驾驶平台和模型 [1] 数据中心加速器产品组合的演进 - 在数据中心加速器环节，产品类型变得多样，Rubin平台在GPU之外，新增了LPU（语言处理单元），开启了GPU与LPU的联合 [1] - 公司推出基于Groq技术的LPU芯片Groq 3和Groq 3 LPX机架，Groq 3 LPX与Rubin CPU和GPU一起使用可将每兆瓦推理吞吐量提高35倍，并将在下半年集成到下一代Vera Rubin AI工厂中 [3] - LPU被定位为Rubin的“增强包”，其特点是具备快速SRAM内存和低延迟推理，但与GPU协同工作才能实现规模化并降低成本，例如让注意力计算在GPU上完成、专家模型矩阵数学运算在LPU上完成 [4][6] 异构计算趋势与GPU的定位 - 行业认为AI基础设施已进入异构世界，没有单一的芯片能把所有事情做到最好，需要根据不同的工作负载（训练/推理、大模型/小模型）采用不同类型的计算，同时需考虑每瓦特算力的价格 [6] - 公司高管认为，尽管可以为特定模型设计ASIC芯片以追求效率，但这会剥夺通过软件优化进一步提升模型性能的可能性，而基于可编程性平台（如GPU）的优化，其95%的技术将适用于生态系统中的每个模型 [7][8] - 公司通过软件优化展现了平台可编程性的价值，例如400名软件工程师通过120万小时的GPU模拟运行，找到了38种软件优化方式，让DeepSeek-R1在同样GPU上的运行性能提升了4倍 [8] - 公司计划后续开放LPU的编程环境，可能通过CUDA或其他方式实现 [9] 物理AI领域的布局 - 公司在物理AI领域进行了广泛部署，包括推出用于机器人开发的Isaac仿真框架、Cosmos和Isaac GROOT开源模型，以及用于增强自动驾驶汽车推理能力的推理VLA模型Alpamayo 1.5 [10] - 公司认为开源对于物理AI的发展至关重要，因为无法由一家公司独自完成构建，需要生态共同贡献，公司作为“AI的中心”和连接者，正推动相关工作 [10] - 公司发布的世界基础模型Cosmos 3，旨在学习基于物理定律的世界运行方式，并开源模型、数据、框架和蓝图，以推动行业发展，目前已被许多世界模型厂商用于训练和评估模型 [10][14] - 自动驾驶汽车的挑战已从科学领域转入工程领域，重点是扩大规模，而通用机器人的挑战则出现在每个维度，包括身体硬件和让机器人学会使用身体的大脑 [14] - 行业正接近一个关键门槛，开始有足够的技术让机器人大脑变得有用，机器人的“ChatGPT时刻”正在到来，例如可以利用推理能力让Cosmos中的智能体生成训练机器人的数据 [15]