GeForce游戏显卡 - 财报，业绩电话会，研报，新闻

GeForce游戏显卡

搜索文档

黄仁勋：龙虾就是新操作系统，英伟达7种芯片拼出算力怪兽，放话2027营收万亿美元

36氪· 2026-03-17 15:27

GTC 2026会议核心观点 - 英伟达GTC 2026大会规模空前，有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人，标志着其已成为AI行业的年度盛会[1] - 公司通过回顾25年发展历程，系统阐述了从游戏显卡到当前AI算力与token经济的演进逻辑，核心论点是AI从感知、生成、推理到执行的每一步都将生成更多token并消耗更多算力，从而驱动巨大的算力需求[4] - 公司宣布，基于Blackwell和Rubin平台到2027年的订单，其预计营收至少将达到1万亿美元，这一数字较去年GTC上提出的5000亿美元高确信需求翻倍，且公司认为实际需求会更高[4] 公司财务与市场预期 - 公司预计到2027年营收至少达到1万亿美元，该预测覆盖Blackwell和Rubin平台到2027年的订单[4] 新一代AI计算系统：Vera Rubin - Vera Rubin是英伟达有史以来最复杂的AI计算系统，采用7种芯片、5种机架垂直集成，包含Rubin GPU、Vera CPU、Groq LP30、BlueField 4 DPU、CX9网卡、NVLink Switch及Spectrum X CPO交换机[15] - Rubin GPU采用全新架构，支持NVLink 72全互联，提供3.6 exaflops算力及260TB/s全对全带宽[15] - Vera CPU采用LPDDR5，单线程性能和能效比出色，已发展成一项价值数十亿美元的业务[15] - 系统采用100%液冷方案，互联在液冷模块内部做板级/背板式集成，使机架安装时间从两天缩短至两小时[21][22] - 采用共封装光学（CPO）技术，通过CoUP封装工艺将光学器件直接封装到芯片上，以突破传统铜缆的物理限制，实现更高能效和更远传输[24][25][26] - 在同一座1GW数据中心中，从Grace Blackwell到Vera Rubin + Groq，token生成速率从200万/秒提升至7亿/秒，两年提升350倍，远超摩尔定律同期约1.5倍的提升[20] 芯片性能与“Token工厂”经济学 - 公司提出“Token工厂”商业模型，以每瓦token吞吐量（产能）和每秒token生成速率（AI“聪明程度”）为核心指标，并划分了从免费层到顶级层（$150/百万Token）的四个服务层级[9] - Grace Blackwell NVLink 72的每瓦token吞吐量比上一代Hopper H200高出50倍[11] - 每瓦性能是决定token成本的关键，在固定功率的数据中心内，更高的每瓦token产出意味着更低的成本[12] - Vera Rubin平台的目标是将每瓦token吞吐量在下一代基础上再提高2-10倍[12] 推理架构创新：GPU与Groq LPU协同 - 公司通过收购Groq获得LPU（语言处理单元）技术，其采用确定性数据流处理器架构，拥有500MB片上SRAM，专为推理设计[16][29] - 公司采用分离式推理架构，通过Dynamo推理框架将计算任务拆分：Pre-fill和attention计算量大，交给Vera Rubin处理；decode阶段对延迟敏感，则卸载给Groq LPU[33] - 该协同方案在最高价值的推理层级上，可再提升35倍吞吐量，并解锁了每秒千token级别的极速生成能力[35] - 公司建议，对于高吞吐工作负载可使用100% Vera Rubin；若有大量编程、工程级token生成需求，可将25%的数据中心功率分配给Groq[35] - Groq 3芯片由三星代工，已量产并预计Q3出货；Vera Rubin首个机架已在微软Azure云上运行[35] 下一代计算平台与未来展望 - 公司预告了下一代计算架构Feynman（费曼），将带来全新的GPU、LPU（LP40）和CPU Rosa，以及BlueField 5 DPU和SuperNIC CX10[47] - Feynman将通过Kyber技术首次同时支持铜线与光学封装的水平扩展，核心突破在于提供更高的容量与带宽[47] - 公司正与合作伙伴联合开发名为“SpaceOne”的太空数据中心计算机，旨在解决太空中的辐射散热问题，拓展“太空算力”[47][49][50] - 公司强调计算架构将每年更新[44] 软件生态与Agent时代 - 公司将OpenClaw定义为AI Agent时代的操作系统，类比Windows之于PC、Linux之于服务器，认为其开源了Agent计算机的操作系统[38][40] - OpenClaw具备资源管理、调度系统和多模态I/O能力，能调用大模型、访问文件系统、使用工具并执行自动化任务[38][40] - 公司断言，每家SaaS公司都将转变为Agent-as-a-Service公司，企业IT逻辑即将被改写[40] - 针对企业安全需求，公司与OpenClaw合作推出企业版NeMo Claw，增加了策略引擎、网络护栏和隐私路由器[42] - 公司描绘未来企业场景：工程师将拥有年度Token预算，其价值可达年薪的一半，Token额度已成为硅谷招聘的新筹码[44]

黄仁勋：龙虾就是新操作系统！英伟达7种芯片拼出算力怪兽，放话2027营收万亿美元

量子位· 2026-03-17 06:12

英伟达GTC 2026核心观点 - 英伟达GTC大会规模空前，有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人，已成为AI行业的年度盛会 [1] - 公司CEO黄仁勋在演讲中系统阐述了从游戏显卡到当前AI算力与Token经济的发展历程，并正式提出到2027年营收预计至少达到1万亿美元的高阶目标 [3][5][6] - 公司股价在演讲期间与现场观众情绪一同高涨 [7] 公司财务与市场前景 - 公司预计到2027年营收至少达到1万亿美元，这一数字覆盖了Blackwell和Rubin平台到2027年的订单，相比去年GTC提出的5000亿美元“高确信需求”翻倍 [5][6] - 公司对实际需求持乐观态度，认为1万亿美元是保守预计，实际需求会更高 [6] Token工厂经济学与商业模式 - 公司提出了一套以“Token吞吐量”（每瓦产出Token数）和“Token速率”（每秒生成Token数）为核心的商业模型与分析框架 [12][13][14] - 该模型将AI服务分为四个层级：免费层（高吞吐、低速率，用于获客）、中间层（3-6美元/百万Token，服务普通用户）、高级层（45美元/百万Token，用于大模型深度推理）、顶级层（150美元/百万Token，用于超长研究任务及关键路径实时响应） [15] - 公司强调“每瓦性能决定一切”，因为在数据中心功率存在物理约束的条件下，更高的每瓦Token产出意味着更低的Token成本 [19] Vera Rubin下一代AI计算系统 - Vera Rubin被定义为公司有史以来最复杂的AI计算系统，是一个包含7种芯片、5种机架的垂直集成、端到端优化的巨型计算机 [24][26][27] - 系统核心组件包括：采用全新架构的Rubin GPU（支持NVLink 72全互联，算力达3.6 exaflops，全对全带宽260TB/s）、全新数据中心CPU Vera、第三代芯片Groq LP30、BlueField 4 DPU + CX9网卡、NVLink Switch以及全球首款量产的共封装光学（CPO）交换机Spectrum X [27][28] - 系统性能实现巨大飞跃：在同一座1GW数据中心内，从Grace Blackwell到Vera Rubin + Groq，Token生成速率从200万/秒跃升至7亿/秒，两年提升350倍，远超同期摩尔定律约1.5倍的提升 [30][31] - 系统通过两大创新突破散热与互联瓶颈：采用100%液冷方案，并在液冷模块内部实现板级/背板式集成互联，使机架安装时间从两天缩短至两小时；采用CPO技术，将光学器件直接封装到芯片上，消除光模块和铜线中转，实现更高能效和更远传输距离 [33][34][35][36][38][40] - 公司强调铜缆与光学技术并非二选一，未来需要同时扩大铜缆、光芯片及CPO的产能 [41] - 从十年前的DGX-1（8块Pascal GPU，170 TFLOPS）到如今的Vera Rubin NVLink 72（3.6 ExaFLOPS），公司算力在十年间增长了四千万倍 [42][43][44] Groq与分离式推理架构 - 公司于2025年底收购了以LPU（语言处理单元）著称的推理芯片公司Groq，其芯片采用确定性数据流处理器架构，片上集成500MB SRAM，专为推理设计 [50] - 公司提出“分离式推理”架构，通过Dynamo推理框架将推理流水线拆分：计算量大的Pre-fill和attention阶段交给Vera Rubin处理，而对带宽和延迟敏感的decode阶段（Token生成）则卸载给Groq处理 [56][57] - 两种极端不同的处理器通过以太网紧密耦合，可将延迟减半 [58] - 公司给出配比建议：高吞吐工作负载可100%使用Vera Rubin；若有大量编程、工程级Token生成需求，可将数据中心25%的功率分配给Groq [60] - Groq 3芯片由三星代工，已量产并预计Q3出货；Vera Rubin首个机架已在微软Azure云上运行 [61][62] OpenClaw与AI Agent时代 - 公司CEO将OpenClaw类比为AI时代的Linux，定义其本质为Agent计算机的操作系统，具备资源管理、调度系统和I/O系统等核心功能 [67][68][69][70] - 公司断言每一次平台转移（如Windows→PC，Linux→服务器）都会催生改变世界的公司，并认为“每家SaaS公司都将变成Agent-as-a-Service公司”，企业IT逻辑即将被改写 [71][72][73][74] - 针对企业级应用的安全与治理需求，公司与OpenClaw合作推出企业版NeMo Claw，增加了策略引擎、网络护栏、隐私路由器等功能 [76] - 公司描绘了未来企业的新范式：工程师将拥有年度Token预算，Token额度甚至可能成为硅谷招聘的新筹码 [79][80][81] 未来技术路线图与前瞻 - 公司预告了下一代计算架构Feynman（费曼），将带来全新的GPU、LPU（LP 40）和CPU Rosa [81][84] - Feynman架构将首次同时支持铜线与光学封装的水平扩展，其核心突破在于提供更高的容量与带宽 [85][86] - 公司正与合作伙伴联合开发名为“英伟达Space One”的太空数据中心计算机，探索“太空算力”，以应对太空环境中独特的辐射散热挑战 [87][89][90][91]