报告行业投资评级 - 高端制造行业评级为“买入”(维持) [5] 报告核心观点 - GTC大会前瞻:英伟达计划在2026年3月GTC大会上发布整合Groq LPU技术的新推理芯片,这标志着AI算力市场向“专用推理”范式转移,将驱动PCB设备和钻针的增量需求 [1][2] - LPU(语言处理单元)专为低延迟AI推理设计,在主流大模型推理上比H100 GPU快约10倍,综合能效提升约10倍,与GPU在AI工作流中形成互补 [2] - LPU的大规模应用将从PCB价值量增加和先进封装两方面带来增量影响:PCB使用面积将呈现数倍增加,材料要求升级至52层M9级覆铜板+Q布方案,钻针消耗量将显著增加;同时,PD分离与3D堆叠方案将提高先进封装要求,带动高精度装联设备需求 [3] - 投资建议:GPU+LPU异构架构加速落地,产业景气度延伸至PCB设备领域,PCB钻针或呈现供不应求及涨价局面,建议关注PCB核心制造环节的设备与耗材生产商 [4] 根据相关目录分别总结 LPU技术特点及其与GPU的互补关系 - LPU是一种专为AI推理,特别是低延迟实时交互设计的专用处理器,通过编译器驱动静态调度和高速片上SRAM(带宽可达80TB/s)实现确定性执行,将首词延迟降至约百毫秒内 [2] - 以Llama2-70B模型为例,LPU推理比H100 GPU快约10倍,综合能效可提升约10倍 [2] - GPU是通用高吞吐架构,依赖大容量HBM显存,是大模型训练和高吞吐任务主力,但在单序列实时生成场景受限于内存带宽和运行时调度 [2] - LPU与GPU形成互补:GPU是模型训练和处理大量上下文(Prefill阶段)的核心;LPU在要求即时响应的文本逐词生成(Decode阶段)优势显著 [2] LPU对PCB产业链的增量影响 - PCB需求面积与材料升级:单颗LPU的230MB SRAM容量有限,运行大模型需数百颗LPU串联,大规模应用LPU所需PCB载板面积较纯GPU方案将呈现数倍增加 [3] - PCB材料要求较高,预计使用52层M9级覆铜板+Q布的增强方案,对钻针消耗量巨大,PCB钻针消耗量将显著增加 [3] - 先进封装要求提升:英伟达提出的PD分离式部署技术可将LLM推理拆分为预填充和解码两阶段,有望实现GPU与LPU互补共存,减少单一LPU部署规模 [3] - 可能利用3D堆叠技术将LPU单元直接堆叠在GPU主芯片之上,通过多芯片协同弥补SRAM容量不足,保持低延迟优势 [3] - GPU+LPU异构架构对封装技术和精度要求较高,预计在PCB电子装联环节对高精度装联设备需求量将进一步提升 [3] 投资建议与关注标的 - 全球AI算力需求持续高速增长,AI推理对低延时需求增强,GPU+LPU异构架构有望加速落地,产业景气度延伸至PCB设备领域,PCB钻针或呈现供不应求及产品涨价的高景气度局面 [4] - 高精度钻孔及曝光环节:建议关注大族数控、英诺激光、帝尔激光等 [4] - PCB高精度装联设备:建议关注凯格精机、劲拓股份等 [4] - 高端PCB钻针:建议关注鼎泰高科、沃尔德、四方达等 [4] - 先进电镀环节:建议关注东威科技等 [4]
PCB 设备系列跟踪报告(三):GTC 大会前瞻:重视 LPU 对 PCB 设备和钻针带来的增量需求