Workflow
即时处理
icon
搜索文档
英伟达发布新平台:每机柜配备256个LPU
财联社· 2026-03-17 09:45
英伟达发布Groq 3 LPU芯片及Vera Rubin平台 - 英伟达在GTC 2026上正式推出全新AI超级计算机平台Vera Rubin,该平台搭载七款芯片,包括Groq 3 LPU、Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU和Spectrum-6以太网交换机 [1] - 公司计划构建包含256个LPU的Groq 3 LPX机架,每个机架提供128GB SRAM(每个LPU集成500MB SRAM)、40 PB/s的推理加速带宽,并通过每个机架640 TB/s的专用扩展接口连接芯片 [1] - Vera Rubin平台由Groq 3 LPX机架与Vera Rubin NVL72、Vera CPU等另外四款机架共同构成,Groq 3 LPX被设计为Vera Rubin的推理加速器,旨在满足智能体系统对低延迟和大上下文的需求 [1] Groq 3 LPU的性能优势与市场预期 - 英伟达表示,LPX与Vera Rubin平台结合后,推理吞吐量/功耗比将能提升35倍 [2] - 分析师预测,在英伟达投资Groq之后,LPU的出货量预测已大幅上调,预计2026至2027年的总出货量将达到400万至500万颗 [2] - 新架构机柜预计于2024年第四季度开始量产,2026年与2027年机柜出货量分别约为300至500个,以及15000至20000个 [2] - LPU芯片将由三星代工,预计机架将于2024年下半年开始出货 [2] LPU的技术特点与应用驱动因素 - LPU具备更快的内存带宽,可缩短大模型推理过程中的延迟,核心瓶颈在于内存带宽 [3] - 基于LPU的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感 [3] - LPU需求快速增长主要来自两方面:一是LPU与英伟达生态系(如CUDA)高度整合,大幅降低应用开发与部署门槛;二是业内超低延迟推理需求快速增加,包括AI智能体、即时处理、终端用户与物理AI等类型应用 [2] - AI已完成从感知智能到生成智能,再到物理智能和智能体智能的关键跃迁 [3] 行业影响与相关投资机会 - 目前Tokens的消耗量大幅增长,带动推理芯片市场规模的高增长,LPU有望在推理芯片市场中逐步渗透,具有高成长性的市场空间 [3] - 机构看好LPU的高成长性及LPU以机柜出货时带来的PCB机会 [3] - 建议关注的相关公司包括:智微智能(参股元川微)、星宸科技(多轮增资元川微)、沪电股份(英伟达PCB供应商)、胜宏科技(英伟达PCB供应商)、深南电路 [3]