硅谷直击:黄仁勋入局龙虾大战,宣告 SaaS 已死,推理算力需求暴涨万倍!

英伟达的战略叙事与计算演进 - 演讲者通过回顾从GeForce到CUDA,再到深度学习、Token经济和Agent的历程,构建了一条完整的计算产业演进主线 [4] - 宣告了SaaS时代的终结,并揭幕了以Agent为主导的新时代 [6] - AI的下一阶段核心是从“更会聊天”转向“真正干活”,即执行实际任务 [7] CUDA生态与护城河 - 2006年CUDA的发布是转折点,使GPU从图形处理器变为通用并行计算机,催生了庞大的软件生态(如cuBLAS、cuFFT、cuDNN、TensorRT) [10][11] - 形成了“CUDA飞轮”:更多库吸引更多开发者,产生更多应用,推动更多GPU部署,进而支持更多研发,形成正向循环 [12][14] - CUDA已成为加速计算时代的底层操作系统,其二十年积累的软件生态、开发习惯和工作流程是公司最深的护城河,难以被复制 [15][16][17] 数据价值与AI角色 - AI并非替代企业传统的结构化数据(如数据库、交易记录),而是通过理解非结构化数据(如文档、邮件、视频)来补全信息,使结构化数据价值倍增 [22][24] - 结构化数据是骨架,非结构化数据是血肉,AI是串联二者的大脑,三者是组合关系 [25] - 企业过去积累的信息资产不会因AI失效,反而会因模型理解能力增强而变得更有价值 [26] AI重心转向推理与Token经济 - AI发展的重心正从训练转向推理 [27][28] - 提出了“Token经济”视角:AI经济的基本单位是Token,成本、收入和吞吐量都取决于Token的生产速度与效率 [29][32] - 由于Agentic AI执行复杂任务(思考、拆解、试错、调用工具),其Token消耗量相比传统对话增长了四个数量级 [34][36] - 未来的数据中心将演变为生产Token的工厂,即“AI Factory” [37][38] 硬件路线图:从Blackwell到Vera Rubin - Blackwell架构被定义为计算产业史上最成功的产品发布之一,已全面量产并被主要云厂商和AI公司部署 [41][43] - 下一代架构Vera Rubin旨在承接Agentic AI带来的需求爆炸,其价值在于让高端推理服务在商业上成立 [45][51] - 关键指标是单位电力产出的Token量(能效)和用户获取结果的速度(交互速度),AI服务将像云服务一样分层 [48][50] - 光子互连技术LPX(Groq 3 LPX)是突破系统规模瓶颈的关键,将芯片互连从铜线推向光,以支持更大规模、低功耗、长距离通信 [54][56] - 在高端场景中,Vera Rubin + LPX相比Blackwell,性能效率提升可达35倍;同样一吉瓦电力,Blackwell对应数百亿美元年收入,Vera Rubin + LPX一代可将该数字提升至3000亿美元 [58][60] 加速的硬件迭代节奏 - 公司正以“一年一代”的速度推进硬件路线图:2025年Blackwell,2026年Vera Rubin,2027年Vera Rubin Ultra,2028年Feynman [62][64] - 这种快节奏颠覆了传统半导体周期,迫使云厂商、国家级算力项目和资本支出计划围绕其路线图进行规划 [66] - 全球正在以类似修建电网、铁路的规模进行AI基础设施建设,AI算力正从企业采购升级为国家战略资产配置 [67][70] Agentic AI与企业软件范式转换 - Agentic AI是一套能感知环境、调用工具、拆解并执行任务的系统,而不仅仅是对话模型 [72] - 提出了“Agent是新的应用,Prompt是新的程序,Token是新的货币”的核心判断,标志着全新计算平台的出现 [74] - 企业软件市场正从SaaS(软件即服务)转向AgaaS(Agent-as-a-Service),即从购买软件模块转向购买“智能劳动力” [75][76][79] - 这意味着价值4.6万亿美元的IT产业,其采购逻辑正从“软件采购”切换为“智能劳动力采购” [80] 从数字世界到物理世界:OpenClaw与NemoClaw - OpenClaw项目旨在将Agent从数字屏幕中带入物理世界,满足AI“动手”做事的朴素需求 [82][83] - NemoClaw是公司为机器人嵌入的“大脑”,使Agent能理解语言、感知环境并执行物理任务 [88][90] - 其展示方式极其简化(一行命令),旨在将机器人开发门槛从机器人学专家降低至会调API的普通开发者 [90][92][94] - 此举旨在复制CUDA和cuDNN的成功模式,将计算能力民主化的逻辑推向机器人和Physical AI领域 [95] Physical AI与数字孪生 - Physical AI的关键是“仿真优先”,通过数字孪生技术在虚拟环境中处理物理世界的复杂性(如摩擦、碰撞) [97] - 公司提供了一整条从数据生成、仿真训练到现实部署的Physical AI开发流水线(包括Isaac Lab、Newton等工具) [99] - 应用已从实验室走向真实产业需求,涉及手术机器人、人形机器人、制造业训练等多个领域 [99] - 以《冰雪奇缘》角色“雪宝”从数字世界走到现实的演示,具象化地说明了数字智能向现实世界外溢的愿景 [100][103][105][106][107]