行业投资评级 - 投资评级:看好(维持)[1] 报告核心观点 - 报告核心观点:Groq 3 LPU超预期发展及Rubin Ultra架构升级将深远影响AI服务器硬件,建议关注算力、互联、散热三大投资主线[6] 技术产品进展:Groq 3 LPU与LPX机架 - Groq 3 LPU单芯片性能跃升:集成500MB SRAM,提供150TB/s带宽,是HBM(22TB/s)的近7倍,精准契合带宽敏感型AI解码需求[3] - Groq 3 LPU算力为1.2 petaFLOPS(8位运算),而Rubin GPU算力为50 petaFLOPS(4位运算),前者以精简设计专精推理[3] - 英伟达将Groq 3 LPU整合为Groq 3 LPX机架,每个机架包含256个LPU,提供128 GB SRAM及40 PB/s推理带宽,芯片间通过640 TB/s扩展接口互联[4] - LPU与Rubin GPU结合后,推理吞吐量/功耗比提升35倍,有望重塑推理成本结构[4] - LPU芯片将由三星代工,量产时间从原计划提前至2026下半年[4] - 后续将推出支持NVFP4的Groq L35以丰富产品矩阵[3] 系统架构升级:Rubin Ultra与Kyber机架 - Rubin Ultra GPU配备高达1 TB HBM4e内存,单封装FP4推理算力达到100 PFLOPS,在内存容量和算力上实现翻倍式提升[5] - Rubin Ultra搭载全新的Kyber机架,全柜合计144个GPU(共计576个 die),采用计算节点垂直插入的颠覆性设计[5] - 架构采用中枢直连架构取代传统铜缆,其中Compute Tray上有4颗Rubin Ultra和2颗Vera CPU,其与Switch tray的连接通过正交背板完成[5] 投资建议与受益环节 - 投资建议关注算力、互联、散热三大主线[6] - PCB环节受益标的包括:沪电股份、胜宏科技、深南电路、景旺电子、鹏鼎控股等[6] - CCL环节受益标的包括:生益科技、南亚新材等[6] - 组装环节受益标的包括:工业富联等[6]
Groq3LPU与GPU协同作战,系统架构如期升级