公司战略定位与愿景 - 公司将自身定位为“AI工厂”的构建者,致力于成为全球计算平台转变的核心推动者 [1][5] - 公司提出“Token工厂经济学”,强调每瓦性能是商业变现的核心,未来AI基础设施将按Token产出和成本来衡量价值 [1][31] - 公司CEO断言,到2027年将看到至少1万亿美元的高确信度AI基础设施需求,且实际需求可能远高于此 [1][28][29] CUDA生态系统与飞轮效应 - 2024年是CUDA诞生20周年,该架构已积累数千种工具、编译器、框架与库,在开源社区拥有数十万个公开项目,并深度集成至每一个主流生态系统 [6] - 公司通过20年构建了数亿颗运行CUDA的GPU和计算系统,覆盖每一家云服务商和计算机厂商,服务几乎每一个行业,形成了庞大的安装基础 [7] - CUDA的庞大安装基础是飞轮效应的根本原因,吸引开发者、催生新算法(如深度学习)、开辟新市场,进而形成更大的安装基础,该飞轮正在持续加速 [7] - 由于架构兼容性和持续的软件优化,公司六年前发布的Ampere架构云端定价至今仍在上涨,同时计算成本持续下降,形成了“扩大覆盖、加速增长、持续压降成本”的动态组合 [8][9] 技术平台与核心创新 - 公司围绕三大平台展开:CUDA-X平台、系统平台以及全新的AI工厂平台,其中生态系统至关重要 [5] - 公司创建了两个基础库以加速未来AI计算:cuDF用于数据框和结构化数据加速;cuVS用于向量存储、语义数据和非结构化AI数据加速 [17][18] - 公司核心战略是“垂直整合,水平开放”,深入理解各个垂直领域的算法并将其整合进计算平台,开放给全世界使用 [19][20] - 本届GTC宣布了100个库和约40个模型的更新,这些库是激活计算平台、解决实际问题的核心资产 [23] - 在图形技术领域,公司推出神经渲染技术DLSS 5,融合可控的3D图形与生成式AI,以实现既美观逼真又完全可控的内容生成 [12][13] 推理拐点与AI演进 - AI经历了从“感知”到“生成”,再到“推理”,最终到“执行”的演进,如今的AI能够完成真正富有成效的工作 [25][26] - 推理拐点已经到来,AI每次思考、执行、读取、推理都需要进行推断,导致Token生成需求爆炸式增长 [26] - 过去两年间,驱动AI计算需求的三件大事是:ChatGPT开启生成式AI时代、推理AI(如o1/o3模型)崛起、以及Claude Code与Agentic AI的诞生 [25] - 过去两年,单次工作的AI计算需求提升了约10,000倍,使用量提升了约100倍,计算总需求的增幅接近100万倍 [26] 产品路线图与性能突破 - 公司公布了从Blackwell到Feynman的清晰技术路线图,包括Vera Rubin、Rubin Ultra等下一代系统 [38] - 在推理性能上取得根本性突破:从Hopper H200到Grace Blackwell,实际每瓦性能提升达到35倍(有分析指出可达50倍),远高于摩尔定律预期的1.5倍 [31] - Grace Blackwell在最具商业价值的服务层级,其吞吐量比Hopper提升35倍,可将整体数据中心收益提升约5倍 [32] - 下一代架构Vera Rubin专为Agentic系统设计,采用全新“Kyber”机架,支持144颗GPU构成单一NVLink域 [36][37] - Vera Rubin系统采用100%液冷,使用45°C热水冷却以降低能耗,安装时间从两天缩短至两小时,并搭载第六代NVLink交换系统 [39] 异构计算与收购整合 - 公司收购了Grok的技术团队并获得技术授权,Grok处理器是确定性数据流处理器,专为推理设计,拥有海量SRAM [40][41] - 公司开发了Dynamo推理解耦框架,将推理流程重新架构,使Vera Rubin与Grok芯片协同工作,将延迟降低约50%,并在最具商业价值的服务层级实现35倍性能提升 [42][43] - Grok LP30由三星代工,已投入量产,预计2026年第三季度开始出货 [44] - 对于Grok的最优部署策略建议:若工作负载以高吞吐量为主,则采用100% Vera Rubin;若有大量高价值代码生成或高速Token需求,则建议将25%算力配置为Grok,其余75%保持Vera Rubin [45] AI工厂与基础设施 - 数据中心正在从存储文件的“数据中心”演变为生产Token的“AI工厂” [62] - 在一个吉瓦级AI工厂中,通过架构优化,仅用两年时间Token生成速率可从2200万提升至7亿,提升幅度达350倍 [46] - 公司创建了英伟达 DSX平台,基于Omniverse进行全系统仿真,让合作伙伴在虚拟世界中共同设计吉瓦级AI工厂,该平台预计能释放约两倍的效率提升 [48][49] - 公司业务构成多元:60%来自五大超大规模云服务商,40%来自区域云、主权云、企业、工业、机器人、边缘和超算等多个领域 [30] Agentic AI与OpenClaw - OpenClaw成为一个重大新发现,是有史以来最受欢迎的开源项目之一,在短短几周内超越了Linux三十年的传播速度,它本质上是Agentic计算机的操作系统 [50][51] - 企业IT正经历范式转变,旧模式是“数据中心-软件工具-人类”,新模式是每一家SaaS公司都将成为提供专业化Agent服务的AaaS公司 [53][54] - 每家企业的关键问题已变为制定自己的OpenClaw战略和Agentic系统战略 [52] - 公司与OpenClaw开发者合作,推出企业级安全参考架构NemoClaw,配备策略引擎、网络护栏和隐私路由器 [54] 行业应用与生态合作 - 本届GTC涵盖了公司生态的几乎所有垂直领域,包括自动驾驶、金融服务、医疗健康、工业制造、娱乐与游戏、机器人、电信等 [21][22] - 在自动驾驶领域,宣布新增比亚迪、现代、日产、吉利四家RoboTaxi合作伙伴,加上已有的奔驰、丰田、通用,这些合作伙伴每年合计生产1800万辆汽车 [60] - 在电信领域(约2万亿美元规模),未来的无线基站将演变为AI边缘计算基础设施(英伟达 Aerial AI RAN) [22][60] - 公司宣布与IBM、戴尔、Google Cloud、AWS、Microsoft Azure、CoreWeave、Oracle、Palantir等众多企业达成重要合作 [19][21] - 110台机器人参展GTC,几乎每家机器人公司都在与英伟达合作 [22] 开放模型与物理AI - 公司已在每个AI领域的前沿模型上确立领导地位,并宣布成立Nemotron联盟,与多家公司合作共同打造Nemotron 4模型 [55][56] - 公司长期致力于物理AI与机器人领域,为机器人系统打造了三台关键计算机:训练计算机、合成数据生成与仿真计算机、以及机器人本体内置计算机 [57][58][59] - 展示了与迪士尼联合开发的“奥拉夫”机器人,基于Jetson计算平台和Omniverse训练环境,实现了真实物理世界中的自适应运动 [61]
英伟达GTC大会全文:黄仁勋宣告推理时代到来,龙虾就是新操作系统!