黄仁勋:龙虾就是新操作系统!英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元
英伟达英伟达(US:NVDA) 量子位·2026-03-17 06:12

英伟达GTC 2026核心观点 - 英伟达GTC大会规模空前,有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人,已成为AI行业的年度盛会 [1] - 公司CEO黄仁勋在演讲中系统阐述了从游戏显卡到当前AI算力与Token经济的发展历程,并正式提出到2027年营收预计至少达到1万亿美元的高阶目标 [3][5][6] - 公司股价在演讲期间与现场观众情绪一同高涨 [7] 公司财务与市场前景 - 公司预计到2027年营收至少达到1万亿美元,这一数字覆盖了Blackwell和Rubin平台到2027年的订单,相比去年GTC提出的5000亿美元“高确信需求”翻倍 [5][6] - 公司对实际需求持乐观态度,认为1万亿美元是保守预计,实际需求会更高 [6] Token工厂经济学与商业模式 - 公司提出了一套以“Token吞吐量”(每瓦产出Token数)和“Token速率”(每秒生成Token数)为核心的商业模型与分析框架 [12][13][14] - 该模型将AI服务分为四个层级:免费层(高吞吐、低速率,用于获客)、中间层(3-6美元/百万Token,服务普通用户)、高级层(45美元/百万Token,用于大模型深度推理)、顶级层(150美元/百万Token,用于超长研究任务及关键路径实时响应) [15] - 公司强调“每瓦性能决定一切”,因为在数据中心功率存在物理约束的条件下,更高的每瓦Token产出意味着更低的Token成本 [19] Vera Rubin下一代AI计算系统 - Vera Rubin被定义为公司有史以来最复杂的AI计算系统,是一个包含7种芯片、5种机架的垂直集成、端到端优化的巨型计算机 [24][26][27] - 系统核心组件包括:采用全新架构的Rubin GPU(支持NVLink 72全互联,算力达3.6 exaflops,全对全带宽260TB/s)、全新数据中心CPU Vera、第三代芯片Groq LP30、BlueField 4 DPU + CX9网卡、NVLink Switch以及全球首款量产的共封装光学(CPO)交换机Spectrum X [27][28] - 系统性能实现巨大飞跃:在同一座1GW数据中心内,从Grace Blackwell到Vera Rubin + Groq,Token生成速率从200万/秒跃升至7亿/秒,两年提升350倍,远超同期摩尔定律约1.5倍的提升 [30][31] - 系统通过两大创新突破散热与互联瓶颈:采用100%液冷方案,并在液冷模块内部实现板级/背板式集成互联,使机架安装时间从两天缩短至两小时;采用CPO技术,将光学器件直接封装到芯片上,消除光模块和铜线中转,实现更高能效和更远传输距离 [33][34][35][36][38][40] - 公司强调铜缆与光学技术并非二选一,未来需要同时扩大铜缆、光芯片及CPO的产能 [41] - 从十年前的DGX-1(8块Pascal GPU,170 TFLOPS)到如今的Vera Rubin NVLink 72(3.6 ExaFLOPS),公司算力在十年间增长了四千万倍 [42][43][44] Groq与分离式推理架构 - 公司于2025年底收购了以LPU(语言处理单元)著称的推理芯片公司Groq,其芯片采用确定性数据流处理器架构,片上集成500MB SRAM,专为推理设计 [50] - 公司提出“分离式推理”架构,通过Dynamo推理框架将推理流水线拆分:计算量大的Pre-fill和attention阶段交给Vera Rubin处理,而对带宽和延迟敏感的decode阶段(Token生成)则卸载给Groq处理 [56][57] - 两种极端不同的处理器通过以太网紧密耦合,可将延迟减半 [58] - 公司给出配比建议:高吞吐工作负载可100%使用Vera Rubin;若有大量编程、工程级Token生成需求,可将数据中心25%的功率分配给Groq [60] - Groq 3芯片由三星代工,已量产并预计Q3出货;Vera Rubin首个机架已在微软Azure云上运行 [61][62] OpenClaw与AI Agent时代 - 公司CEO将OpenClaw类比为AI时代的Linux,定义其本质为Agent计算机的操作系统,具备资源管理、调度系统和I/O系统等核心功能 [67][68][69][70] - 公司断言每一次平台转移(如Windows→PC,Linux→服务器)都会催生改变世界的公司,并认为“每家SaaS公司都将变成Agent-as-a-Service公司”,企业IT逻辑即将被改写 [71][72][73][74] - 针对企业级应用的安全与治理需求,公司与OpenClaw合作推出企业版NeMo Claw,增加了策略引擎、网络护栏、隐私路由器等功能 [76] - 公司描绘了未来企业的新范式:工程师将拥有年度Token预算,Token额度甚至可能成为硅谷招聘的新筹码 [79][80][81] 未来技术路线图与前瞻 - 公司预告了下一代计算架构Feynman(费曼),将带来全新的GPU、LPU(LP 40)和CPU Rosa [81][84] - Feynman架构将首次同时支持铜线与光学封装的水平扩展,其核心突破在于提供更高的容量与带宽 [85][86] - 公司正与合作伙伴联合开发名为“英伟达Space One”的太空数据中心计算机,探索“太空算力”,以应对太空环境中独特的辐射散热挑战 [87][89][90][91]

黄仁勋:龙虾就是新操作系统!英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元 - Reportify