Workflow
GeForce游戏显卡
icon
搜索文档
黄仁勋:龙虾就是新操作系统,英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元
36氪· 2026-03-17 15:27
GTC 2026会议核心观点 - 英伟达GTC 2026大会规模空前,有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人,标志着其已成为AI行业的年度盛会[1] - 公司通过回顾25年发展历程,系统阐述了从游戏显卡到当前AI算力与token经济的演进逻辑,核心论点是AI从感知、生成、推理到执行的每一步都将生成更多token并消耗更多算力,从而驱动巨大的算力需求[4] - 公司宣布,基于Blackwell和Rubin平台到2027年的订单,其预计营收至少将达到1万亿美元,这一数字较去年GTC上提出的5000亿美元高确信需求翻倍,且公司认为实际需求会更高[4] 公司财务与市场预期 - 公司预计到2027年营收至少达到1万亿美元,该预测覆盖Blackwell和Rubin平台到2027年的订单[4] 新一代AI计算系统:Vera Rubin - Vera Rubin是英伟达有史以来最复杂的AI计算系统,采用7种芯片、5种机架垂直集成,包含Rubin GPU、Vera CPU、Groq LP30、BlueField 4 DPU、CX9网卡、NVLink Switch及Spectrum X CPO交换机[15] - Rubin GPU采用全新架构,支持NVLink 72全互联,提供3.6 exaflops算力及260TB/s全对全带宽[15] - Vera CPU采用LPDDR5,单线程性能和能效比出色,已发展成一项价值数十亿美元的业务[15] - 系统采用100%液冷方案,互联在液冷模块内部做板级/背板式集成,使机架安装时间从两天缩短至两小时[21][22] - 采用共封装光学(CPO)技术,通过CoUP封装工艺将光学器件直接封装到芯片上,以突破传统铜缆的物理限制,实现更高能效和更远传输[24][25][26] - 在同一座1GW数据中心中,从Grace Blackwell到Vera Rubin + Groq,token生成速率从200万/秒提升至7亿/秒,两年提升350倍,远超摩尔定律同期约1.5倍的提升[20] 芯片性能与“Token工厂”经济学 - 公司提出“Token工厂”商业模型,以每瓦token吞吐量(产能)和每秒token生成速率(AI“聪明程度”)为核心指标,并划分了从免费层到顶级层($150/百万Token)的四个服务层级[9] - Grace Blackwell NVLink 72的每瓦token吞吐量比上一代Hopper H200高出50倍[11] - 每瓦性能是决定token成本的关键,在固定功率的数据中心内,更高的每瓦token产出意味着更低的成本[12] - Vera Rubin平台的目标是将每瓦token吞吐量在下一代基础上再提高2-10倍[12] 推理架构创新:GPU与Groq LPU协同 - 公司通过收购Groq获得LPU(语言处理单元)技术,其采用确定性数据流处理器架构,拥有500MB片上SRAM,专为推理设计[16][29] - 公司采用分离式推理架构,通过Dynamo推理框架将计算任务拆分:Pre-fill和attention计算量大,交给Vera Rubin处理;decode阶段对延迟敏感,则卸载给Groq LPU[33] - 该协同方案在最高价值的推理层级上,可再提升35倍吞吐量,并解锁了每秒千token级别的极速生成能力[35] - 公司建议,对于高吞吐工作负载可使用100% Vera Rubin;若有大量编程、工程级token生成需求,可将25%的数据中心功率分配给Groq[35] - Groq 3芯片由三星代工,已量产并预计Q3出货;Vera Rubin首个机架已在微软Azure云上运行[35] 下一代计算平台与未来展望 - 公司预告了下一代计算架构Feynman(费曼),将带来全新的GPU、LPU(LP40)和CPU Rosa,以及BlueField 5 DPU和SuperNIC CX10[47] - Feynman将通过Kyber技术首次同时支持铜线与光学封装的水平扩展,核心突破在于提供更高的容量与带宽[47] - 公司正与合作伙伴联合开发名为“SpaceOne”的太空数据中心计算机,旨在解决太空中的辐射散热问题,拓展“太空算力”[47][49][50] - 公司强调计算架构将每年更新[44] 软件生态与Agent时代 - 公司将OpenClaw定义为AI Agent时代的操作系统,类比Windows之于PC、Linux之于服务器,认为其开源了Agent计算机的操作系统[38][40] - OpenClaw具备资源管理、调度系统和多模态I/O能力,能调用大模型、访问文件系统、使用工具并执行自动化任务[38][40] - 公司断言,每家SaaS公司都将转变为Agent-as-a-Service公司,企业IT逻辑即将被改写[40] - 针对企业安全需求,公司与OpenClaw合作推出企业版NeMo Claw,增加了策略引擎、网络护栏和隐私路由器[42] - 公司描绘未来企业场景:工程师将拥有年度Token预算,其价值可达年薪的一半,Token额度已成为硅谷招聘的新筹码[44]
黄仁勋:龙虾就是新操作系统!英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元
量子位· 2026-03-17 06:12
英伟达GTC 2026核心观点 - 英伟达GTC大会规模空前,有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人,已成为AI行业的年度盛会 [1] - 公司CEO黄仁勋在演讲中系统阐述了从游戏显卡到当前AI算力与Token经济的发展历程,并正式提出到2027年营收预计至少达到1万亿美元的高阶目标 [3][5][6] - 公司股价在演讲期间与现场观众情绪一同高涨 [7] 公司财务与市场前景 - 公司预计到2027年营收至少达到1万亿美元,这一数字覆盖了Blackwell和Rubin平台到2027年的订单,相比去年GTC提出的5000亿美元“高确信需求”翻倍 [5][6] - 公司对实际需求持乐观态度,认为1万亿美元是保守预计,实际需求会更高 [6] Token工厂经济学与商业模式 - 公司提出了一套以“Token吞吐量”(每瓦产出Token数)和“Token速率”(每秒生成Token数)为核心的商业模型与分析框架 [12][13][14] - 该模型将AI服务分为四个层级:免费层(高吞吐、低速率,用于获客)、中间层(3-6美元/百万Token,服务普通用户)、高级层(45美元/百万Token,用于大模型深度推理)、顶级层(150美元/百万Token,用于超长研究任务及关键路径实时响应) [15] - 公司强调“每瓦性能决定一切”,因为在数据中心功率存在物理约束的条件下,更高的每瓦Token产出意味着更低的Token成本 [19] Vera Rubin下一代AI计算系统 - Vera Rubin被定义为公司有史以来最复杂的AI计算系统,是一个包含7种芯片、5种机架的垂直集成、端到端优化的巨型计算机 [24][26][27] - 系统核心组件包括:采用全新架构的Rubin GPU(支持NVLink 72全互联,算力达3.6 exaflops,全对全带宽260TB/s)、全新数据中心CPU Vera、第三代芯片Groq LP30、BlueField 4 DPU + CX9网卡、NVLink Switch以及全球首款量产的共封装光学(CPO)交换机Spectrum X [27][28] - 系统性能实现巨大飞跃:在同一座1GW数据中心内,从Grace Blackwell到Vera Rubin + Groq,Token生成速率从200万/秒跃升至7亿/秒,两年提升350倍,远超同期摩尔定律约1.5倍的提升 [30][31] - 系统通过两大创新突破散热与互联瓶颈:采用100%液冷方案,并在液冷模块内部实现板级/背板式集成互联,使机架安装时间从两天缩短至两小时;采用CPO技术,将光学器件直接封装到芯片上,消除光模块和铜线中转,实现更高能效和更远传输距离 [33][34][35][36][38][40] - 公司强调铜缆与光学技术并非二选一,未来需要同时扩大铜缆、光芯片及CPO的产能 [41] - 从十年前的DGX-1(8块Pascal GPU,170 TFLOPS)到如今的Vera Rubin NVLink 72(3.6 ExaFLOPS),公司算力在十年间增长了四千万倍 [42][43][44] Groq与分离式推理架构 - 公司于2025年底收购了以LPU(语言处理单元)著称的推理芯片公司Groq,其芯片采用确定性数据流处理器架构,片上集成500MB SRAM,专为推理设计 [50] - 公司提出“分离式推理”架构,通过Dynamo推理框架将推理流水线拆分:计算量大的Pre-fill和attention阶段交给Vera Rubin处理,而对带宽和延迟敏感的decode阶段(Token生成)则卸载给Groq处理 [56][57] - 两种极端不同的处理器通过以太网紧密耦合,可将延迟减半 [58] - 公司给出配比建议:高吞吐工作负载可100%使用Vera Rubin;若有大量编程、工程级Token生成需求,可将数据中心25%的功率分配给Groq [60] - Groq 3芯片由三星代工,已量产并预计Q3出货;Vera Rubin首个机架已在微软Azure云上运行 [61][62] OpenClaw与AI Agent时代 - 公司CEO将OpenClaw类比为AI时代的Linux,定义其本质为Agent计算机的操作系统,具备资源管理、调度系统和I/O系统等核心功能 [67][68][69][70] - 公司断言每一次平台转移(如Windows→PC,Linux→服务器)都会催生改变世界的公司,并认为“每家SaaS公司都将变成Agent-as-a-Service公司”,企业IT逻辑即将被改写 [71][72][73][74] - 针对企业级应用的安全与治理需求,公司与OpenClaw合作推出企业版NeMo Claw,增加了策略引擎、网络护栏、隐私路由器等功能 [76] - 公司描绘了未来企业的新范式:工程师将拥有年度Token预算,Token额度甚至可能成为硅谷招聘的新筹码 [79][80][81] 未来技术路线图与前瞻 - 公司预告了下一代计算架构Feynman(费曼),将带来全新的GPU、LPU(LP 40)和CPU Rosa [81][84] - Feynman架构将首次同时支持铜线与光学封装的水平扩展,其核心突破在于提供更高的容量与带宽 [85][86] - 公司正与合作伙伴联合开发名为“英伟达Space One”的太空数据中心计算机,探索“太空算力”,以应对太空环境中独特的辐射散热挑战 [87][89][90][91]