Workflow
专用推理
icon
搜索文档
光大证券:英伟达(NVDA.US)计划引入LPU方案 AI推理有望延伸至PCB设备领域
智通财经网· 2026-03-03 17:17
文章核心观点 - 英伟达计划在新芯片架构中引入LPU方案,标志着AI算力市场正经历从“通用计算”向“专用推理”的范式转移 [1] - LPU方案落地将显著增加PCB需求面积并提升板材加工难度,预计为PCB微钻及PCB加工设备带来较大增量需求 [1] - AI推理对低延时需求增强,GPU+LPU异构架构有望加速落地,产业景气度将延伸至PCB设备领域,PCB钻针可能呈现供不应求及涨价的高景气度局面 [1] LPU技术特点及其与GPU的互补关系 - LPU是一种专为AI推理设计的专用处理器,核心是通过“编译器驱动”的静态调度和高速片上SRAM来消除内存瓶颈,实现确定性执行 [1] - LPU片上SRAM带宽可达80TB/s,能将首试延迟降至约百毫秒内,在主流大模型推理上比H100 GPU快约10倍,综合能效可提升约10倍 [1] - GPU是通用高吞吐架构,依赖大容量HBM显存,擅长大规模并行计算,但在单序列、实时生成的场景中会受限于内存带宽和运行时调度,难以突破低延迟瓶颈 [2] - LPU与GPU在AI工作流中形成互补:GPU是模型训练和处理大量上下文的核心;LPU则在要求即时响应的文本逐词生成中优势显著,适合高并发的在线推理服务 [2] LPU方案对PCB产业链的增量影响 - **PCB使用面积增加与材料升级**:单颗LPU的230MB SRAM存在容量瓶颈,运行大规模模型需要数百颗LPU串联,大规模应用LPU将使所需PCB载板面积较纯GPU架构方案呈现数倍增加 [3] - 为考虑信号传输效率,LPU所需PCB材料要求较高,预计将使用52层M9级覆铜板+Q布的增强方案,对钻针消耗量巨大 [3] - **先进封装要求提高**:英伟达提出的PD分离式部署技术可将LLM推理拆分为计算密集型的预填充和内存密集型的解码两个阶段 [3] - 面对LPU集群大规模堆集带来的空间与布线问题,公司有望通过PD分离技术实现GPU与LPU互补共存,减少单一LPU部署规模 [3] - 公司亦有望利用3D堆叠技术,将LPU单元直接堆叠在GPU主芯片之上,通过多芯片协同弥补SRAM容量不足,同时保持低延迟优势 [3] - GPU+LPU的异构架构对封装技术和精度要求较高,预计在PCB电子装联环节对高精度装联设备的需求量将进一步提升 [3] 相关投资标的 - **高精度钻孔及曝光环节**:建议关注大族数控、英诺激光、帝尔激光等 [4] - **PCB高精度装联设备**:建议关注凯格精机、劲拓股份等 [4] - **高端PCB钻针**:建议关注鼎泰高科、沃尔德、四方达等 [4] - **先进电镀环节**:建议关注东威科技等 [4]
PCB 设备系列跟踪报告(三):GTC 大会前瞻:重视 LPU 对 PCB 设备和钻针带来的增量需求
光大证券· 2026-03-02 16:45
报告行业投资评级 - 高端制造行业评级为“买入”(维持) [5] 报告核心观点 - GTC大会前瞻:英伟达计划在2026年3月GTC大会上发布整合Groq LPU技术的新推理芯片,这标志着AI算力市场向“专用推理”范式转移,将驱动PCB设备和钻针的增量需求 [1][2] - LPU(语言处理单元)专为低延迟AI推理设计,在主流大模型推理上比H100 GPU快约10倍,综合能效提升约10倍,与GPU在AI工作流中形成互补 [2] - LPU的大规模应用将从PCB价值量增加和先进封装两方面带来增量影响:PCB使用面积将呈现数倍增加,材料要求升级至52层M9级覆铜板+Q布方案,钻针消耗量将显著增加;同时,PD分离与3D堆叠方案将提高先进封装要求,带动高精度装联设备需求 [3] - 投资建议:GPU+LPU异构架构加速落地,产业景气度延伸至PCB设备领域,PCB钻针或呈现供不应求及涨价局面,建议关注PCB核心制造环节的设备与耗材生产商 [4] 根据相关目录分别总结 LPU技术特点及其与GPU的互补关系 - LPU是一种专为AI推理,特别是低延迟实时交互设计的专用处理器,通过编译器驱动静态调度和高速片上SRAM(带宽可达80TB/s)实现确定性执行,将首词延迟降至约百毫秒内 [2] - 以Llama2-70B模型为例,LPU推理比H100 GPU快约10倍,综合能效可提升约10倍 [2] - GPU是通用高吞吐架构,依赖大容量HBM显存,是大模型训练和高吞吐任务主力,但在单序列实时生成场景受限于内存带宽和运行时调度 [2] - LPU与GPU形成互补:GPU是模型训练和处理大量上下文(Prefill阶段)的核心;LPU在要求即时响应的文本逐词生成(Decode阶段)优势显著 [2] LPU对PCB产业链的增量影响 - **PCB需求面积与材料升级**:单颗LPU的230MB SRAM容量有限,运行大模型需数百颗LPU串联,大规模应用LPU所需PCB载板面积较纯GPU方案将呈现数倍增加 [3] - PCB材料要求较高,预计使用52层M9级覆铜板+Q布的增强方案,对钻针消耗量巨大,PCB钻针消耗量将显著增加 [3] - **先进封装要求提升**:英伟达提出的PD分离式部署技术可将LLM推理拆分为预填充和解码两阶段,有望实现GPU与LPU互补共存,减少单一LPU部署规模 [3] - 可能利用3D堆叠技术将LPU单元直接堆叠在GPU主芯片之上,通过多芯片协同弥补SRAM容量不足,保持低延迟优势 [3] - GPU+LPU异构架构对封装技术和精度要求较高,预计在PCB电子装联环节对高精度装联设备需求量将进一步提升 [3] 投资建议与关注标的 - 全球AI算力需求持续高速增长,AI推理对低延时需求增强,GPU+LPU异构架构有望加速落地,产业景气度延伸至PCB设备领域,PCB钻针或呈现供不应求及产品涨价的高景气度局面 [4] - **高精度钻孔及曝光环节**:建议关注大族数控、英诺激光、帝尔激光等 [4] - **PCB高精度装联设备**:建议关注凯格精机、劲拓股份等 [4] - **高端PCB钻针**:建议关注鼎泰高科、沃尔德、四方达等 [4] - **先进电镀环节**:建议关注东威科技等 [4]
PCB设备系列跟踪报告(三):GTC大会前瞻:重视LPU对PCB设备和钻针带来的增量需求
光大证券· 2026-03-02 16:15
行业投资评级 - 高端制造行业评级为“买入”(维持) [5] 报告核心观点 - 英伟达计划在2026年3月的GTC大会上发布整合Groq LPU技术的新推理芯片,标志着AI算力市场从“通用计算”向“专用推理”的范式转移 [1][2] - LPU具有低时延高带宽特点,在AI推理中与GPU形成互补,其落地将显著增加对PCB(印制电路板)设备和钻针的增量需求 [1][2][3] - GPU+LPU的异构架构有望加速落地,产业景气度将延伸至PCB设备领域,PCB钻针可能呈现供不应求及产品涨价的高景气度局面 [4] 根据相关目录分别总结 LPU技术特点及其与GPU的互补关系 - LPU是专为AI推理设计的专用处理器,通过编译器驱动静态调度和高速片上SRAM(带宽可达80TB/s)实现确定性执行,将首词延迟降至约百毫秒内 [2] - 以Llama2-70B模型为例,LPU推理比H100 GPU快约10倍,综合能效可提升约10倍 [2] - GPU依赖大容量HBM显存,擅长大规模并行计算,是模型训练和高吞吐任务的主力,但在单序列实时生成场景受限于内存带宽和运行时调度 [2] - LPU与GPU在AI工作流中互补:GPU是模型训练和处理大量上下文(Prefill阶段)的核心;LPU在要求即时响应的文本逐词生成(Decode阶段)优势显著 [2] LPU对PCB产业链的增量影响 - **PCB使用面积增加与材料升级**:由于单颗LPU的230MB SRAM容量有限,运行大模型需数百颗LPU串联,大规模应用LPU所需PCB载板面积较纯GPU方案将呈现数倍增加 [3] - 为保障信号传输效率,LPU所需PCB材料要求高,预计将使用52层M9级覆铜板+Q布的增强方案,对钻针消耗量巨大,PCB钻针消耗量将显著增加 [3] - **先进封装要求提升**:英伟达提出的PD分离式部署技术可将LLM推理拆分为预填充和解码两阶段,有望实现GPU与LPU互补共存,减少单一LPU部署规模 [3] - 为解决LPU集群带来的空间与布线问题,可能利用3D堆叠技术将LPU单元堆叠在GPU主芯片之上,实现多芯片协同 [3] - GPU+LPU异构架构对封装技术和精度要求高,预计在PCB电子装联环节对高精度装联设备的需求量将进一步提升 [3] 投资建议与关注标的 - 全球AI算力需求持续高速增长,AI推理对低延时需求增强,建议关注PCB核心制造环节的设备生产商 [4] - **高精度钻孔及曝光环节**:建议关注大族数控、英诺激光、帝尔激光 [4] - **PCB高精度装联设备**:建议关注凯格精机、劲拓股份 [4] - **高端PCB钻针**:建议关注鼎泰高科、沃尔德、四方达 [4] - **先进电镀环节**:建议关注东威科技 [4]