LPU技术
搜索文档
探究英伟达Rubin-Ultra硬件形态
2026-04-13 14:13
纪要涉及的行业或公司 * 公司:英伟达 (NVIDIA) [1] * 行业:半导体、人工智能芯片、光模块、PCB、光纤连接器、封测 [1][3][4] 核心观点与论据 * **Rubin Ultra封装方案调整**:方案可能从四Die合封转向双Die合封,旨在降低大面积硅片封装导致的基板翘曲风险并提升良率 [1][2] * **供应链影响分化**: * **光模块、PCB、光纤连接器受益**:原封装内部通过IC载板的连接将外部化,由PCB、光模块、光纤及连接器实现,带动需求量和价值量双增 [1][3][4] * **封测环节受损**:单次封装复杂度与工艺难度降低,导致单颗芯片封装价值量下降,封测厂商业务价值面临减损 [1][4] * **LPU技术整合**:NVIDIA收购Groq后,其LPU技术将与GPU形成高低搭配,专攻访存密集型的Decode阶段以降低HBM成本,而非替代高端GPU [1][4] * **多芯片协同推升互联需求**:LPU与GPU协同工作,以及可能出现的Rubin CPX、LPU和Rubin Ultra三种芯片协同模式,将显著增加芯片间互联需求,进一步促进光模块、PCB、连接器和光纤等需求 [4] * **MoE架构挑战与应对**:MoE模型参数量激增(例如从百亿级别100+B发展到七百亿级别700+B),导致单卡显存难承载KV Cache溢出,要求机柜内具备高速互联能力 [1][5] * **Rubin Ultra的技术预期**:预计将落地更成熟的内存统一编址方案,以支持更大规模MoE模型的推理需求 [1][5] 其他重要内容 * **方案调整背景**:原四Die(“2+2”结构)合封方案旨在提升单芯片峰值性能以维持算力约每两年翻倍的承诺,并配合通道数更多的HBM4,但面临更大的物理挑战和良率问题 [2] * **需求前提假设**:到2027年,若整体的Token消耗量、模型参数量及总计算需求确定,且单颗计算Die算力不变,则所需计算Die总数量相对确定,封装方案改变主要重塑Die间互联方式 [3] * **具体板级方案**:若改为双Die合封,为达到原有计算规模,可能采用“双Die x 2”的板级方案,即在OAM模组的Compute Tray主板上集成两个双Die封装组合 [4]