英伟达2026 GTC大会核心发布与战略 - 公司通过整合收购的Groq技术与新推出的OpenClaw生态解决方案,构建了新的增长叙事,旨在解决AI推理中的高吞吐与低延迟矛盾,并开拓高达3000亿美元的增量市场机会 [6][7][11] - 公司CEO黄仁勋预测,从2025年到2027年,公司的芯片业务规模将持续增长至1万亿美元 [12] - 公司发布了下一代AI基础设施Vera Rubin系统,并预告了2028年的Feynman架构,确立了每年更新一代产品的技术路线图 [14][61] Vera Rubin系统与Groq LPU整合 - Vera Rubin系统采用端到端垂直整合设计,作为一台超级计算机进行优化,核心Rubin GPU采用台积电3nm工艺,拥有3360亿晶体管 [14][17] - Rubin GPU配备288GB HBM4内存和22TB/s带宽,推理性能达50 PFLOPs,比上一代Blackwell提升5倍;训练性能达35 PFLOPs,提升3.5倍 [17] - 系统首次集成Groq 3 LPU,采用确定性数据流架构和SRAM,专为低延迟的token生成设计,单颗芯片SRAM容量为500MB [18][21] - 公司通过Dynamo软件实现“解耦推理”,由Rubin GPU负责prefill和attention,Groq LPU负责feed-forward的decode,两者通过以太网紧耦合使延迟减半 [21][22] - 由256颗Groq 3 LPU组成的LPX整机可提供128GB SRAM、40 PB/s的带宽以及315 PFLOPs的推理算力 [31][33] - 整套NVL72系统采用100%液冷设计,使用45度热水冷却,安装时间从两天压缩至两小时,并配备了第六代NVLink和首款CPO交换机Spectrum X [35] 市场机遇与商业模式创新 - 整合Groq的Vera Rubin系统能为客户解锁一个价值3000亿美元的增量营收机会 [7][9] - 公司预测,到2027年,市场对其产品的需求将至少达到1万亿美元,主要驱动力是“推理拐点”,即AI从聊天向能推理、能干活(Agent)的演进导致单次推理算力需求和使用量暴增 [40] - 公司通过一张“推理性能与效率驱动公司业绩”的图表,将硬件性能与商业定价直接挂钩,定义了从免费到150美元/百万token的五档服务层级 [47][50][51] - 图表显示,Vera Rubin系统使45美元/百万token的Premium层级服务变得经济可行,而结合Groq LPX后,能让一个尚不存在的150美元/百万token的Ultra层级服务成为可能 [51][56] - 据测算,一个1GW数据中心,若将25%算力分配给各服务层级,Blackwell架构年营收可达300亿美元,Vera Rubin架构可达1500亿美元(5倍),而Vera Rubin + Groq LPX组合可达3000亿美元(10倍) [54][56] - 公司CEO提出“数据中心是生产token的工厂”,算力直接等同于营收,并宣称英伟达的系统是全球范围内可获取的成本最低的AI基础设施 [59] OpenClaw生态与NemoClaw战略 - 公司将OpenClaw定位为与Windows、Linux同级的新计算平台,认为其是Agent时代的操作系统,几周内GitHub Star数便超越了Linux三十年的积累 [68] - 针对企业应用的安全顾虑,公司推出了NemoClaw解决方案,为核心是OpenShell,为企业OpenClaw应用提供策略引擎、网络护栏和隐私路由等安全层 [69][70] - 公司将NemoClaw与CUDA类比,旨在使OpenClaw从个人玩具转变为企业级基础设施,并预测未来每家SaaS公司都将转变为生成式服务公司,企业IT市场将从2万亿美元的工具产业升级为价值数万亿美元的Agent产业 [71] - 公司预测,未来工程师的薪酬包可能包含年度token预算,个人生产力可借此放大10倍 [71] 技术路线图与未来产品预告 - 公司产品路线图明确:当前为Blackwell,2026年下半年推出Vera Rubin,2027年推出Rubin Ultra搭配Kyber机架,2028年推出Feynman架构 [61] - Feynman架构将包含全新GPU、LP40 LPU、Rosa CPU、BlueField 5 DPU等七个全部换代的组件 [61] - 公司还提及了Vera Rubin Space-1项目,计划将计算模块送入太空构建数据中心 [63] 软件、模型与生态合作 - 公司宣布成立Nemotron开源模型联盟,涵盖语言推理、物理AI、自动驾驶、机器人等多个前沿领域,其中Nemotron 3 Ultra定位为全球最好的基础模型,供各国定制主权AI [75] - 联盟首批成员包括Mistral、Perplexity、LangChain等知名公司 [75] - 公司CEO透露,其100%的软件工程师都在使用Claude Code,并称其为第一个Agentic模型 [40]
直击GTC:1万亿美元GPU、为龙虾做“CUDA”,老黄就指着你烧token了