黄仁勋GTC演讲全文:推理时代到来,2027营收至少万亿美元,龙虾就是新操作系统
英伟达英伟达(US:NVDA) 硬AI·2026-03-17 17:11

公司战略定位与业绩指引 - 公司将自身定位从芯片公司转变为“AI工厂”和AI基础设施构建者 [5] - 公司CEO对2027年之前的高确信度AI计算需求预期从一年前的5000亿美元上调至至少1万亿美元 [8] - 该需求预期推动了公司股价上涨超过4.3%,并且CEO认为实际需求将远超1万亿美元 [10][12] Token工厂经济学 - 提出“Token工厂经济学”,认为未来数据中心是生产Token的工厂,其商业命脉由每瓦性能决定,在固定电力限制下,每瓦Token吞吐量最高的方案成本最低 [13][15] - 将AI服务划分为四个商业层级:免费层(高吞吐、低速度)、中级层(约每百万token 3美元)、高级层(约每百万token 6美元)、高速层(约每百万token 45美元) [16] - 公司架构能使客户在免费层实现高吞吐量,并在最高价值的推理层级上将性能提升35倍 [18] 新一代硬件系统与架构 - 推出Vera Rubin系统,这是一个100%液冷、端到端优化的完整AI计算系统,安装时间从两天缩短至两小时 [20][75] - Vera Rubin系统在两年内将1吉瓦数据中心的Token生成速率从2200万token/秒提升至7亿token/秒,实现了350倍的性能提升,远超摩尔定律同期的约1.5倍提升 [21][82] - 通过收购Groq并整合其技术,提出非对称分离推理方案,将计算密集的“预填充”阶段交给Vera Rubin,将对延迟敏感的“解码”阶段交给Groq,以解决极速推理的瓶颈 [22][24] - Groq LP30芯片由三星代工,已进入量产,预计第三季度出货 [25][81] 软件生态与智能体革命 - 断言每一个SaaS公司都将转变为AaaS(智能体即服务)公司,并推出企业级NeMo Claw参考设计以保障智能体安全 [28] - 将开源项目OpenClaw形容为“人类历史上最受欢迎的开源项目”,称其在几周内超越了Linux过去30年的成就,并将其定义为智能体计算机的“操作系统” [27][89] - 预测未来职场形态将包括“年薪+Token预算”,工程师的基础年薪可能为几十万美元,公司会额外提供约一半年薪的Token额度,以实现10倍效率提升 [29][95] 技术平台与合作伙伴生态 - CUDA平台诞生二十周年,拥有数千种工具和数十万个开源项目,其庞大的装机量是公司飞轮效应的基石 [35][36] - 公司业务60%来自全球前五大云服务商,40%广泛分布于主权云、企业、工业、机器人和边缘计算等领域 [13][66] - 宣布与多家巨头达成合作,包括IBM、Dell、Google Cloud等,例如与Google Cloud合作将Snapchat的计算成本降低了近80% [45][47] - 宣布Anthropic和Meta正式加入NVIDIA平台,共同代表了全球三分之一的AI算力需求 [66] 行业应用与未来展望 - 公司CUDA-X库已深度布局多个垂直行业,包括自动驾驶、金融服务、医疗健康、工业、娱乐、机器人及电信等 [54] - 过去两年风险投资流入AI初创企业的资金达到1500亿美元,创历史纪录,单笔投资规模跃升至数亿乃至数十亿美元 [58] - 指出过去两年AI推理所需的计算量增长了约10,000倍,使用量增长了约100倍,并认为计算需求总体增长了100万倍 [63] - 公布下一代计算架构Feynman路线图,并透露正在研发部署在太空的数据中心计算机“Vera Rubin Space-1” [30][88]