报告行业投资评级 - 通信行业评级为“推荐”,且为“维持”评级 [1] 报告的核心观点 - 英伟达引领AI基建时代,其推出的全新AI超算平台Vera Rubin及整合的LPU技术将拓展推理边界,算力军备竞赛趋势延续 [1][3] - 英伟达创始人兼CEO黄仁勋将公司2025-2027年在AI算力芯片方面的累计营业收入指引上调至至少1万亿美元,较2025年GTC大会对2025-2026年的预测翻倍 [3] - 过去三年AI产业里程碑产品推动单个工作负载计算量提升约1万倍,整体使用量提升约100倍,彰显算力高景气 [3] - 液冷技术确定性加强,Vera Rubin采用100%液冷设计,黄仁勋预测传统IDC液冷渗透率会超过50%,AIDC最终会达到100% [3] - 投资建议关注光模块与CPO、光芯片、液冷、太空算力等产业链相关赛道 [3] 根据相关目录分别进行总结 英伟达新产品与性能 - 英伟达在2026年GTC大会正式推出全新AI超算平台Vera Rubin,集成Vera CPU、Rubin GPU、NVLink 6交换机等共7款芯片,并新纳入Groq 3 LPU [3] - Rubin架构GPU将于2026年下半年量产,采用台积电3nm工艺,单GPU在NVFP4精度下训练算力达35 PFlops,推理算力达50 PFlops [3] - Rubin规模化训练与推理能效较Blackwell架构分别提升3.5倍与5倍 [3] - 在训练大型MoE模型时,Rubin所需GPU数量仅为Blackwell的1/4,同时每瓦推理Token吞吐量提升10倍 [3] - 在1GW的IDC内,采用Rubin平台的Token生成速率可达7亿/秒 [3] - 下一代架构Feynman同步问世,采用台积电1.6nm A16制程,首度引入芯片级光互联,较Rubin带宽密度提升10倍,传输能耗下降90% [3] LPU技术整合与推理市场 - 2025年12月英伟达斥资约200亿美元与Groq达成授权协议,其创始人兼CEO Jonathan Ross加入英伟达负责LPU技术整合 [3] - LPU采用基于SRAM的片上存储以显著降低时延,顺应AI Agent、物理AI等即时处理应用趋势,并与CUDA生态高度契合 [3] - LPU将作为“Token加速器”集成至Vera Rubin平台专攻解码,以保障在每百万Token 150美元以上的超高速层AI服务中的性能输出 [3] - 此举是对其他CSP大厂自研ASIC芯片抢占推理市场份额的有力回击 [3] - 由三星代工的Groq LP30芯片已进入量产阶段,预计2026年第三季度出货 [3] - Groq3 LPX机架上的LPU密度自64个增加至256个后,出货量预期也随之大幅上修 [3] 液冷与太空算力发展 - Vera Rubin平台采用100%液冷设计,使用45℃温水冷却,安装时间从2天缩短至2小时 [3] - Vera Rubin升级到NVL 144后将抬高单机柜液冷组件价值量 [3] - 英伟达推出Space-1 Vera Rubin模块,专为尺寸、重量、功率受限的太空环境设计,可为轨道IDC等提供边缘AI推理服务,较H100实现25倍的性能飞跃 [3] 投资建议关注标的 - 报告建议关注以下产业链相关公司 [3] - 光模块与CPO:中际旭创、新易盛、天孚通信、光迅科技、华工科技等 - 光芯片:仕佳光子、源杰科技、长光华芯等 - 液冷:英维克、阿莱德等 - 太空算力:普天科技、通宇通讯等
通信行业行业:英伟达引领AI基建时代 LPU拓展推理边界