英伟达GTC大会全文：黄仁勋宣告推理时代到来，龙虾就是新操作系统！

公司战略定位与愿景 - 公司将自身定位为“AI工厂”的构建者，致力于成为全球计算平台转变的核心推动者 [1][5] - 公司提出“Token工厂经济学”，强调每瓦性能是商业变现的核心，未来AI基础设施将按Token产出和成本来衡量价值 [1][31] - 公司CEO断言，到2027年将看到至少1万亿美元的高确信度AI基础设施需求，且实际需求可能远高于此 [1][28][29] CUDA生态系统与飞轮效应 - 2024年是CUDA诞生20周年，该架构已积累数千种工具、编译器、框架与库，在开源社区拥有数十万个公开项目，并深度集成至每一个主流生态系统 [6] - 公司通过20年构建了数亿颗运行CUDA的GPU和计算系统，覆盖每一家云服务商和计算机厂商，服务几乎每一个行业，形成了庞大的安装基础 [7] - CUDA的庞大安装基础是飞轮效应的根本原因，吸引开发者、催生新算法（如深度学习）、开辟新市场，进而形成更大的安装基础，该飞轮正在持续加速 [7] - 由于架构兼容性和持续的软件优化，公司六年前发布的Ampere架构云端定价至今仍在上涨，同时计算成本持续下降，形成了“扩大覆盖、加速增长、持续压降成本”的动态组合 [8][9] 技术平台与核心创新 - 公司围绕三大平台展开：CUDA-X平台、系统平台以及全新的AI工厂平台，其中生态系统至关重要 [5] - 公司创建了两个基础库以加速未来AI计算：cuDF用于数据框和结构化数据加速；cuVS用于向量存储、语义数据和非结构化AI数据加速 [17][18] - 公司核心战略是“垂直整合，水平开放”，深入理解各个垂直领域的算法并将其整合进计算平台，开放给全世界使用 [19][20] - 本届GTC宣布了100个库和约40个模型的更新，这些库是激活计算平台、解决实际问题的核心资产 [23] - 在图形技术领域，公司推出神经渲染技术DLSS 5，融合可控的3D图形与生成式AI，以实现既美观逼真又完全可控的内容生成 [12][13] 推理拐点与AI演进 - AI经历了从“感知”到“生成”，再到“推理”，最终到“执行”的演进，如今的AI能够完成真正富有成效的工作 [25][26] - 推理拐点已经到来，AI每次思考、执行、读取、推理都需要进行推断，导致Token生成需求爆炸式增长 [26] - 过去两年间，驱动AI计算需求的三件大事是：ChatGPT开启生成式AI时代、推理AI（如o1/o3模型）崛起、以及Claude Code与Agentic AI的诞生 [25] - 过去两年，单次工作的AI计算需求提升了约10,000倍，使用量提升了约100倍，计算总需求的增幅接近100万倍 [26] 产品路线图与性能突破 - 公司公布了从Blackwell到Feynman的清晰技术路线图，包括Vera Rubin、Rubin Ultra等下一代系统 [38] - 在推理性能上取得根本性突破：从Hopper H200到Grace Blackwell，实际每瓦性能提升达到35倍（有分析指出可达50倍），远高于摩尔定律预期的1.5倍 [31] - Grace Blackwell在最具商业价值的服务层级，其吞吐量比Hopper提升35倍，可将整体数据中心收益提升约5倍 [32] - 下一代架构Vera Rubin专为Agentic系统设计，采用全新“Kyber”机架，支持144颗GPU构成单一NVLink域 [36][37] - Vera Rubin系统采用100%液冷，使用45°C热水冷却以降低能耗，安装时间从两天缩短至两小时，并搭载第六代NVLink交换系统 [39] 异构计算与收购整合 - 公司收购了Grok的技术团队并获得技术授权，Grok处理器是确定性数据流处理器，专为推理设计，拥有海量SRAM [40][41] - 公司开发了Dynamo推理解耦框架，将推理流程重新架构，使Vera Rubin与Grok芯片协同工作，将延迟降低约50%，并在最具商业价值的服务层级实现35倍性能提升 [42][43] - Grok LP30由三星代工，已投入量产，预计2026年第三季度开始出货 [44] - 对于Grok的最优部署策略建议：若工作负载以高吞吐量为主，则采用100% Vera Rubin；若有大量高价值代码生成或高速Token需求，则建议将25%算力配置为Grok，其余75%保持Vera Rubin [45] AI工厂与基础设施 - 数据中心正在从存储文件的“数据中心”演变为生产Token的“AI工厂” [62] - 在一个吉瓦级AI工厂中，通过架构优化，仅用两年时间Token生成速率可从2200万提升至7亿，提升幅度达350倍 [46] - 公司创建了英伟达 DSX平台，基于Omniverse进行全系统仿真，让合作伙伴在虚拟世界中共同设计吉瓦级AI工厂，该平台预计能释放约两倍的效率提升 [48][49] - 公司业务构成多元：60%来自五大超大规模云服务商，40%来自区域云、主权云、企业、工业、机器人、边缘和超算等多个领域 [30] Agentic AI与OpenClaw - OpenClaw成为一个重大新发现，是有史以来最受欢迎的开源项目之一，在短短几周内超越了Linux三十年的传播速度，它本质上是Agentic计算机的操作系统 [50][51] - 企业IT正经历范式转变，旧模式是“数据中心-软件工具-人类”，新模式是每一家SaaS公司都将成为提供专业化Agent服务的AaaS公司 [53][54] - 每家企业的关键问题已变为制定自己的OpenClaw战略和Agentic系统战略 [52] - 公司与OpenClaw开发者合作，推出企业级安全参考架构NemoClaw，配备策略引擎、网络护栏和隐私路由器 [54] 行业应用与生态合作 - 本届GTC涵盖了公司生态的几乎所有垂直领域，包括自动驾驶、金融服务、医疗健康、工业制造、娱乐与游戏、机器人、电信等 [21][22] - 在自动驾驶领域，宣布新增比亚迪、现代、日产、吉利四家RoboTaxi合作伙伴，加上已有的奔驰、丰田、通用，这些合作伙伴每年合计生产1800万辆汽车 [60] - 在电信领域（约2万亿美元规模），未来的无线基站将演变为AI边缘计算基础设施（英伟达 Aerial AI RAN） [22][60] - 公司宣布与IBM、戴尔、Google Cloud、AWS、Microsoft Azure、CoreWeave、Oracle、Palantir等众多企业达成重要合作 [19][21] - 110台机器人参展GTC，几乎每家机器人公司都在与英伟达合作 [22] 开放模型与物理AI - 公司已在每个AI领域的前沿模型上确立领导地位，并宣布成立Nemotron联盟，与多家公司合作共同打造Nemotron 4模型 [55][56] - 公司长期致力于物理AI与机器人领域，为机器人系统打造了三台关键计算机：训练计算机、合成数据生成与仿真计算机、以及机器人本体内置计算机 [57][58][59] - 展示了与迪士尼联合开发的“奥拉夫”机器人，基于Jetson计算平台和Omniverse训练环境，实现了真实物理世界中的自适应运动 [61]