【招商电子】英伟达GTC 2026跟踪报告:25-27年DC收入超1万亿美元,Kyber将使用铜光等多种互连形式

文章核心观点 英伟达GTC 2026大会展示了公司在AI计算领域的全面布局和战略演进,核心观点是AI推理拐点已至,计算需求正经历百万倍级别的爆发式增长,公司通过推出Rubin计算平台、深化垂直整合、构建AI工厂以及推动OpenClaw等生态战略,旨在巩固并扩大其在下一代AI基础设施中的领导地位,为万亿美元级别的市场机会奠定基础 [2][3][51][59][61]。 根据相关目录分别进行总结 1 CUDA生态与计算平台演进 - CUDA平台诞生20周年,其庞大的装机量(数以亿计的GPU和计算系统)形成了强大的飞轮效应,吸引了大量开发者并创造了新的市场和生态系统,使英伟达基础设施具有非凡的使用寿命和持续降低的计算成本 [8][9][10] - 公司通过GeForce将CUDA带入世界,并开启了AI大爆炸,随后通过RTX架构和DLSS 5技术,将3D图形的结构化数据与生成式AI的概率计算融合,实现了可控且逼真的内容生成 [10][13][14] - 英伟达构建了加速计算平台,包括RTX、cuDF、cuVS等核心库,并将其深度集成到全球云服务和OEM设备中,持续降低客户的计算成本 [25][26] 2 数据处理技术:cuDF与cuVS - 英伟达创建了cuDF和cuVS两个基础库,分别用于加速处理结构化数据(如SQL数据帧)和非结构化数据(如PDF、视频),旨在为AI时代重塑数据处理方式 [15][18][21] - 公司与IBM、戴尔、谷歌云等客户合作,加速其数据处理平台,例如使用cuDF加速IBM Watsonx.data,为雀巢将数据处理速度提高5倍,成本降低83% [22][24] - 加速数据处理带来了速度、规模和成本优势,是超越摩尔定律极限的新方法 [25][26] 3 垂直整合与行业应用 - 英伟达是一家垂直整合但横向开放的计算公司,通过深入理解特定领域算法并构建领域特定加速库(如CUDA-X),将加速计算整合进入各个行业 [41][43][48] - 公司业务覆盖金融服务(算法交易)、医疗保健(药物研发)、工业(AI工厂建设)、机器人、电信(AI-RAN)等多个价值数万亿美元的垂直行业 [46][47][48] - 通过加密计算等技术,公司能够将AI平台安全地部署在任何环境,包括云端、本地、边缘或特定国家 [32][41] 4 AI推理拐点与计算需求爆发 - AI推理的拐点已经到来,AI从感知、生成演进到能够执行生产性工作的推理阶段,这导致计算需求暴增 [59] - 过去两年中,工作的计算需求可能增长了一百万倍,生成输出所需的Token数量增加了约一万倍 [2][59][60] - 风险投资向AI初创企业注入了1500亿美元的历史最高资金,这些公司需要海量的算力和Token,推动了行业爆发式增长 [52] 5 数据中心业务与订单前景 - 英伟达数据中心业务60%来自前五大云服务提供商(CSP),其余40%来自区域云、主权云、企业、工业等领域,展现了业务的多样性 [3][66] - 公司对Blackwell和Rubin架构的订单预期大幅上调,从去年GTC提到的2026年前5000亿美元订单,更新为2027年前至少1万亿美元订单 [3][61][62] - 英伟达平台是唯一能够运行所有AI模型(语言、生物学、机器人学等)且在所有方面都表现优异的平台,这使其成为成本最低、置信度最高的基础设施投资选择 [65] 6 AI工厂与token经济学 - 数据中心正转变为受物理功率限制的“AI工厂”,其产出(Token)是新的商品,工厂的吞吐量(Token/秒)和交互速度直接决定其收入 [4][68][75] - Token商品将根据模型能力、速度和上下文长度细分为不同价值层级(如免费层、每百万Token 3美元至150美元不等),形成新的定价体系 [4][90] - 通过极端协同设计,Grace Blackwell NVLink 72系统相比Hopper,在最高价值量层级的每瓦性能(吞吐量)提高了35倍,而Vera Rubin系统在Blackwell基础上再提高10倍,结合Groq LPU后能再提升35倍 [4][71][93][98][105] 7 Rubin计算平台详解 - Vera Rubin平台是为智能体AI设计的革命性系统,包含7个芯片、5个机架级计算机和1台AI超级计算机,10年内计算能力提升4000万倍 [3][81] - 平台关键组件包括:100%液冷、无线缆设计的Rubin计算板;集成巨大片上SRAM的Groq 3 LPU计算板(已量产);使用台积电COUPE工艺的CPO Spectrum-X交换机(已量产);以及每瓦性能为世界任何CPU两倍的Vera CPU [3][81][83][86][87] - Rubin Ultra芯片正在流片,将首次整合NVFP4计算结构,下一代Feynman平台将包含新GPU(LP40)、新CPU(Rosa)和BlueField-5 [3][128][129] 8 性能比较与收入影响 - 在1吉瓦的AI工厂中,假设将电力平均分配给四个价值层级客户,R系列(Rubin)收入是B系列(Blackwell)的5倍,Rubin结合LPU的收入是B系列的10倍 [4][101][107] - 通过架构创新和协同设计,英伟达在两年内将1吉瓦工厂的Token生成速度从200万/秒提升至7亿/秒,提高了350倍 [126] - Groq LPU(500MB SRAM,150TB/s带宽)与Vera Rubin通过Dynamo软件解耦集成,专门处理解码的前馈网络部分,两者结合实现每兆瓦吞吐量35倍的提升 [5][81][113] 9 下一代架构与供应链 - 公司同时推进铜缆和光缆scale up方案,Oberon架构支持铜缆scale up及通过光scale up至NVLink 576,Kyber架构则实现NVLink 144,所有这些方案均已投产 [2][3][128] - Feynman平台将同时使用铜缆和共封装光学(CPO)进行纵向扩展,公司呼吁供应链扩大铜缆、光学和CPO的产能以满足增长需求 [129] - 公司已建立强大的供应链,每周可生产数千套系统,每月能生产多吉瓦的AI工厂,Vera Rubin机架已开始在Microsoft Azure上运行 [119][121] 10 生态战略:Nemotron联盟与OpenClaw - 英伟达建立Nemotron联盟,联合Black Forest Labs、Cursor、Mistral、Perplexity等公司,推动领域特定模型与主权AI定制化,并推出OpenClaw战略及NemoClaw参考设计,旨在将企业IT从工具时代转型为“智能体”时代 [6][143] - OpenClaw是开源的智能体计算机操作系统,其受欢迎程度和重要性被类比为开启PC时代的Windows,它使得每一家IT公司、SaaS公司都将转型为智能体即服务(AaaS)公司 [5][6][151][152] - 公司宣布与比亚迪、现代、日产、吉利及优步在自动驾驶领域合作,并集结了110个机器人及ABB、库卡等巨头,通过Isaac Lab等工具加速机器人行业应用 [6] 11 前沿领域拓展:太空算力与数字孪生 - 英伟达正与客户研发抗辐射的Vera Rubin Space One新型计算机,旨在未来于太空中建立数据中心 [5][141] - 公司推出英伟达 DSX平台,这是一个基于Omniverse的数字孪生蓝图,用于设计和管理AI工厂,以实现最大的Token吞吐量、韧性和能效,涉及从仿真、设计到动态运营的全流程 [135][136][137]