公司战略定位与业务扩展 - 公司业务范围显著扩充,从以GPU闻名转变为一家包揽AI基础设施或AI工厂多个环节的厂商,产品涵盖数据中心加速器、机架、网络产品和多款开源模型 [1] - 在以大型云厂商为客户的60%业务之外,公司正积极拓展其余40%的业务,物理AI中的自动驾驶和机器人成为两个重要抓手,不仅提供硬件,还开发自动驾驶平台和模型 [1] 数据中心加速器产品组合的演进 - 在数据中心加速器环节,产品类型变得多样,Rubin平台在GPU之外,新增了LPU(语言处理单元),开启了GPU与LPU的联合 [1] - 公司推出基于Groq技术的LPU芯片Groq 3和Groq 3 LPX机架,Groq 3 LPX与Rubin CPU和GPU一起使用可将每兆瓦推理吞吐量提高35倍,并将在下半年集成到下一代Vera Rubin AI工厂中 [3] - LPU被定位为Rubin的“增强包”,其特点是具备快速SRAM内存和低延迟推理,但与GPU协同工作才能实现规模化并降低成本,例如让注意力计算在GPU上完成、专家模型矩阵数学运算在LPU上完成 [4][6] 异构计算趋势与GPU的定位 - 行业认为AI基础设施已进入异构世界,没有单一的芯片能把所有事情做到最好,需要根据不同的工作负载(训练/推理、大模型/小模型)采用不同类型的计算,同时需考虑每瓦特算力的价格 [6] - 公司高管认为,尽管可以为特定模型设计ASIC芯片以追求效率,但这会剥夺通过软件优化进一步提升模型性能的可能性,而基于可编程性平台(如GPU)的优化,其95%的技术将适用于生态系统中的每个模型 [7][8] - 公司通过软件优化展现了平台可编程性的价值,例如400名软件工程师通过120万小时的GPU模拟运行,找到了38种软件优化方式,让DeepSeek-R1在同样GPU上的运行性能提升了4倍 [8] - 公司计划后续开放LPU的编程环境,可能通过CUDA或其他方式实现 [9] 物理AI领域的布局 - 公司在物理AI领域进行了广泛部署,包括推出用于机器人开发的Isaac仿真框架、Cosmos和Isaac GROOT开源模型,以及用于增强自动驾驶汽车推理能力的推理VLA模型Alpamayo 1.5 [10] - 公司认为开源对于物理AI的发展至关重要,因为无法由一家公司独自完成构建,需要生态共同贡献,公司作为“AI的中心”和连接者,正推动相关工作 [10] - 公司发布的世界基础模型Cosmos 3,旨在学习基于物理定律的世界运行方式,并开源模型、数据、框架和蓝图,以推动行业发展,目前已被许多世界模型厂商用于训练和评估模型 [10][14] - 自动驾驶汽车的挑战已从科学领域转入工程领域,重点是扩大规模,而通用机器人的挑战则出现在每个维度,包括身体硬件和让机器人学会使用身体的大脑 [14] - 行业正接近一个关键门槛,开始有足够的技术让机器人大脑变得有用,机器人的“ChatGPT时刻”正在到来,例如可以利用推理能力让Cosmos中的智能体生成训练机器人的数据 [15]
对话英伟达业务副总裁:机器人的“ChatGPT时刻”正在到来