AI五层结构
搜索文档
科技:GTC2026前瞻:RubinUltra与Feynman细节或更新,LPU值得期待
华泰证券· 2026-03-12 11:05
行业投资评级 - 科技行业评级为“增持”,且评级维持不变 [5] 报告核心观点 - 报告预计GTC 2026大会的核心在于AI推理上升为系统级基础设施,Rubin与Rubin Ultra构成平台底座,Feynman延续长期架构优势,CPX与LPU分别面向Prefill计算和超低延迟Decode,CPO与光互连或为焦点 [2] - 报告重申两项趋势:2026年或成为Agentic AI的元年,CPO将迈入实质性落地阶段;英伟达近期整合Groq以及对Lumentum与Coherent合计约40亿美元的投资印证了未来趋势 [2] - 报告认为,英伟达CEO黄仁勋提出的AI五层结构(能源→芯片→基础设施→模型→应用)与报告此前对AI Factory体系的判断基本一致 [2][12] 产品与技术路线图 - **Rubin Ultra与Kyber机架**:预计GTC 2026重点将转向Rubin Ultra及其配套的Kyber机架(NVL576),该机柜或集成144颗Rubin Ultra GPU(共576个die),整机功耗约600 kW,采用800VDC供电,系统采用四机箱纵向排列,每个机箱配置18个compute blade,每个blade集成8个GPU die [2][7] - **Feynman架构**:TrendForce预计Feynman或采用台积电A16工艺并引入SPR背部供电,计划于2028年推出;其I/O die亦存在外包至Intel的可能 [2] - **LPU整合路径**:报告认为独立的LPU机架(或命名LPX)可能是阶段性方案;长期看,自Feynman架构起,Groq的LPU能力有望逐步纳入英伟达GPU路线图,并以架构级方式融入CUDA软件栈;据Semi Vision报道,英伟达正评估256颗LPU版本的LPX机架(初代仅为64颗LPU) [3][8] - **CPX存储方案**:考虑到GDDR7供给偏紧以及Prefill阶段互连带宽需求可能高于预期,报告预计CPX的存储方案或由128GB GDDR7转向HBM4,这可能造成HBM供给进一步紧缺 [3] - **高端存储供应链**:据韩国每日经济新闻报道,三星与海力士已进入Rubin的高端存储供应链,而美光或主要面向CPX等推理产品供货 [3] 光互连与CPO演进 - **CPO重要性**:报告预计CPO与光互连将为GTC 2026重要主题,看好硅光沿Scale-Out→Scale-Up→OIO的演进路径,2027年或成为CPO放量的重要时间节点 [4] - **Scale-Out CPO交换机**:Rubin已开始导入Scale-Out CPO,其中Spectrum-6800和Quantum X800带宽分别为409.6 Tb/s(512×800G)与115.2 Tb/s(144×800G) [4][10] - **Scale-Up CPO交换机**:预计本次GTC或推出Scale-Up CPO交换机以配套Rubin Ultra(可能为双柜架构,区别于NVL576单柜架构) [4] - **封装平台**:报告看好台积电COUPE或为CPO封装的主流平台;英伟达与博通等客户正加速推进COUPE平台适配;台积电有望通过COUPE与CoWoS技术结合,实现光电互连与先进封装的一体化集成 [4] - **长期展望**:报告认为CPO封装或进一步下沉至GPU芯片层面,从而推动OIO全光互连架构逐步落地 [4] 系统设计与互连技术 - **Kyber机架互连**:Semi Vision预计系统将引入正交背板(Orthogonal Backplane),通过78层PCB实现GPU与NVSwitch互连,大幅减少铜缆使用,并采用M9与PTFE复合材料降低信号损耗 [2] - **LPX机架设计**:Semi Vision报道,LPX机架将采用52层M9 Q-glass PCB以支持互连 [3]