LPU（语言处理单元） - 财报，业绩电话会，研报，新闻

LPU（语言处理单元）

搜索文档

PCB 设备系列跟踪报告（三）：GTC 大会前瞻：重视 LPU 对 PCB 设备和钻针带来的增量需求

光大证券· 2026-03-02 16:45

报告行业投资评级 - 高端制造行业评级为“买入”（维持） [5] 报告核心观点 - GTC大会前瞻：英伟达计划在2026年3月GTC大会上发布整合Groq LPU技术的新推理芯片，这标志着AI算力市场向“专用推理”范式转移，将驱动PCB设备和钻针的增量需求 [1][2] - LPU（语言处理单元）专为低延迟AI推理设计，在主流大模型推理上比H100 GPU快约10倍，综合能效提升约10倍，与GPU在AI工作流中形成互补 [2] - LPU的大规模应用将从PCB价值量增加和先进封装两方面带来增量影响：PCB使用面积将呈现数倍增加，材料要求升级至52层M9级覆铜板+Q布方案，钻针消耗量将显著增加；同时，PD分离与3D堆叠方案将提高先进封装要求，带动高精度装联设备需求 [3] - 投资建议：GPU+LPU异构架构加速落地，产业景气度延伸至PCB设备领域，PCB钻针或呈现供不应求及涨价局面，建议关注PCB核心制造环节的设备与耗材生产商 [4] 根据相关目录分别总结 LPU技术特点及其与GPU的互补关系 - LPU是一种专为AI推理，特别是低延迟实时交互设计的专用处理器，通过编译器驱动静态调度和高速片上SRAM（带宽可达80TB/s）实现确定性执行，将首词延迟降至约百毫秒内 [2] - 以Llama2-70B模型为例，LPU推理比H100 GPU快约10倍，综合能效可提升约10倍 [2] - GPU是通用高吞吐架构，依赖大容量HBM显存，是大模型训练和高吞吐任务主力，但在单序列实时生成场景受限于内存带宽和运行时调度 [2] - LPU与GPU形成互补：GPU是模型训练和处理大量上下文（Prefill阶段）的核心；LPU在要求即时响应的文本逐词生成（Decode阶段）优势显著 [2] LPU对PCB产业链的增量影响 - **PCB需求面积与材料升级**：单颗LPU的230MB SRAM容量有限，运行大模型需数百颗LPU串联，大规模应用LPU所需PCB载板面积较纯GPU方案将呈现数倍增加 [3] - PCB材料要求较高，预计使用52层M9级覆铜板+Q布的增强方案，对钻针消耗量巨大，PCB钻针消耗量将显著增加 [3] - **先进封装要求提升**：英伟达提出的PD分离式部署技术可将LLM推理拆分为预填充和解码两阶段，有望实现GPU与LPU互补共存，减少单一LPU部署规模 [3] - 可能利用3D堆叠技术将LPU单元直接堆叠在GPU主芯片之上，通过多芯片协同弥补SRAM容量不足，保持低延迟优势 [3] - GPU+LPU异构架构对封装技术和精度要求较高，预计在PCB电子装联环节对高精度装联设备需求量将进一步提升 [3] 投资建议与关注标的 - 全球AI算力需求持续高速增长，AI推理对低延时需求增强，GPU+LPU异构架构有望加速落地，产业景气度延伸至PCB设备领域，PCB钻针或呈现供不应求及产品涨价的高景气度局面 [4] - **高精度钻孔及曝光环节**：建议关注大族数控、英诺激光、帝尔激光等 [4] - **PCB高精度装联设备**：建议关注凯格精机、劲拓股份等 [4] - **高端PCB钻针**：建议关注鼎泰高科、沃尔德、四方达等 [4] - **先进电镀环节**：建议关注东威科技等 [4]