LPU架构 - 财报，业绩电话会，研报，新闻

LPU架构

搜索文档

寒武纪：2025 年业绩快报点评LPU引领推理算力创新，国产算力龙头新机遇可期-20260228

国联民生证券· 2026-02-28 18:25

报告投资评级 - 维持“推荐”评级 [4][8][9] 报告核心观点 - 公司是国产AI芯片龙头，2025年业绩迎来重要拐点，实现扭亏为盈，并有望在LPU（语言处理单元）发展大趋势下，凭借前瞻性技术布局和创新研究成果，长期受益于AI推理算力需求增长 [8][9] 2025年业绩表现 - **营业总收入**：2025年实现64.97亿元，同比增长453% [8] - **归母净利润**：2025年实现20.59亿元，上年同期为-4.52亿元，实现扭亏为盈 [8] - **扣非归母净利润**：2025年实现17.70亿元，上年同期为-8.65亿元 [8] - **第四季度业绩**：2025Q4归母净利润4.5亿元，同比增长67%；扣非归母净利润3.5亿元，上年同期约为-250万元 [8] - **业绩增长原因**：受益于人工智能行业算力需求持续攀升，公司凭借产品竞争力拓展市场，推动AI应用场景落地，带动收入规模大幅增长 [8] 行业趋势与技术创新 - **LPU架构重要性提升**：2025年12月，英伟达与AI推理芯片公司Groq达成200亿美元技术许可协议，旨在获取其低延迟、高效率的LPU推理技术，以加深平台护城河 [8] - **LPU性能优势**：现有LPUs（如Groq LPU、Cerebras WSE）通过预加载权重或固化数据流，能效较传统CPU、GPU、NPU提升4~20倍 [8] - **行业能耗挑战**：预计到2028年美国AI数据中心将占用12%的总电力容量，核心原因是当前LPUs和GPU在自回归解码中反复调取千亿级权重参数，导致功耗提升 [3] - **硬连线LPU创新**：为从根本上解决能耗问题，需将LPU专用化推向极致，提出硬连线LPU（Hardwired LPU），通过将权重参数物理硬连线到计算架构中，实现架构与模型完美匹配、零参数调取开销及极致计算效率 [3] - **技术挑战与突破**：直接硬连线GPT-OSS 120B模型在5nm工艺下需要176,000mm²的CMAC阵列，经济性存挑战；论文提出“金属嵌入”方法，将权重嵌入金属线3D拓扑，使硬连线LPU的非经常性工程成本进入经济可行范围 [3] - **公司研究成果**：中科院计算所与公司团队在ASPLOS2026发表的论文提出了硬连线神经语言处理单元（HNLPU）架构 [8] - **HNLPU性能数据**：在5nm工艺下，HNLPU实现249,960 tokens/s的吞吐量，是英伟达H100的5555倍、Cerebras WSE-3的85倍；能效达到36 tokens/J，是H100的1047倍、WSE-3的283倍；总芯片面积为13,232mm² [3][9] 财务预测与估值 - **营业收入预测**：预计2025-2027年营业收入分别为64.97亿元、95.37亿元、118.53亿元 [9] - **归母净利润预测**：预计2025-2027年归母净利润分别为20.59亿元、36.28亿元、51.28亿元 [9] - **每股收益预测**：预计2025-2027年EPS分别为4.88元、8.60元、12.16元 [9] - **市盈率预测**：对应2025-2027年PE分别为241倍、137倍、97倍 [9] - **毛利率趋势**：预计毛利率从2024年的56.7%持续提升至2027年的67.0% [10] - **净资产收益率**：预计ROE从2025年的13.24%提升至2027年的22.69% [10]

华尔街日报：英伟达在下月GTC大会推出“新推理芯片”，融入Groq LPU设计

美股IPO· 2026-02-28 16:04

文章核心观点 - 英伟达计划推出整合Groq LPU技术的新型推理芯片，并已为Meta大规模部署纯CPU方案，旨在应对AI行业从训练向推理部署转移的趋势，通过多元化硬件组合巩固其市场地位 [1][3][6][7] GTC大会新品发布与LPU技术整合 - 公司计划在下月GTC开发者大会上发布一款整合Groq“语言处理单元”（LPU）技术的全新推理芯片，首席执行官黄仁勋称其为“世界从未见过”的全新系统 [3] - 该芯片专为加速AI模型的查询响应而设计，预计将重塑当前AI算力市场格局，直接影响云服务提供商和企业级投资者 [3] - 新产品可能基于具备颠覆性的下一代Feynman架构，该架构可能采用更广泛的SRAM集成方案，甚至通过3D堆叠技术深度整合LPU，专门针对延迟和内存带宽两大推理瓶颈进行优化 [1][5] - 公司去年底斥资200亿美元获得了Groq的关键技术许可，并吸纳了包括创始人Jonathan Ross在内的高管团队 [5] 市场认可与客户动向 - OpenAI已同意成为新处理器的最大客户之一，宣布将向英伟达购买大规模的“专用推理产能”，这一举动稳固了公司核心客户盘 [3] - OpenAI的承诺采购与投资总额达300亿美元 [1] - OpenAI同时也在寻求其他供应商，例如与初创公司Cerebras达成了一项价值数十亿美元的计算合作，并与亚马逊签署了使用Trainium芯片的重大协议 [7] 战略调整：纯CPU部署方案 - 公司在引入LPU架构的同时，也在灵活调整其传统处理器的使用方式，本月宣布扩大与Meta Platforms的合作，进行了首次大规模的纯CPU部署，以支持Meta的广告定向AI智能体 [1][6] - 此举表明公司正超越单一的GPU销售模式，试图通过多元化的硬件组合来锁定AI市场的不同细分领域 [6] - 部分大型企业客户发现，在处理某些特定的AI智能体工作负载时，纯CPU环境比将Vera CPU与Rubin GPU捆绑的成本更低且能效更高 [6] 行业背景与竞争态势 - AI行业正从模型训练向实际应用部署转移，推理计算成为核心焦点，大型AI模型的解码过程尤其缓慢 [4] - 许多构建和运营AI智能体的公司发现，传统的GPU成本过于昂贵，且在实际运行模型时并非最佳选择 [7] - 主要云服务商在加紧自研芯片，例如Anthropic Claude Code主要依赖亚马逊AWS和Alphabet旗下谷歌云设计的芯片 [7] - 面对竞争，公司强调正从单纯的芯片供应商向涵盖半导体、数据中心、云和应用的完整AI生态系统构建者转型 [7] - 下月的GTC大会将是检验公司能否在推理时代延续其90%市场份额神话的关键节点 [7]

寒武纪（688256）：2025 年业绩快报点评：LPU引领推理算力创新，国产算力龙头新机遇可期

国联民生证券· 2026-02-28 15:54

报告投资评级 - 维持“推荐”评级 [4][9] 核心业绩与财务表现 - 2025年度实现营业总收入64.97亿元，同比增长453% [8] - 2025年度实现归母净利润20.59亿元，上年同期为-4.52亿元，实现扭亏为盈 [8] - 2025年第四季度归母净利润4.5亿元，同比增长67%；扣非归母净利润3.5亿元，上年同期约为-250万元 [8] - 业绩大幅增长核心原因为人工智能行业算力需求持续攀升，公司产品竞争力强，积极推动应用场景落地 [8] - 预计公司2025-2027年营业收入分别为64.97/95.37/118.53亿元，归母净利润为20.59/36.28/51.28亿元 [9] - 预计2025-2027年每股收益（EPS）分别为4.88/8.60/12.16元，对应市盈率（PE）分别为241倍、137倍、97倍 [9] - 2025年毛利率预计为60.4%，并预计在2026年、2027年进一步提升至63.9%和67.0% [10] 技术创新与行业趋势 - 现有AI基础设施面临高能耗问题，预计到2028年美国AI数据中心将占用12%总电力容量 [3] - LPU（语言处理单元）架构是重要发展趋势，英伟达与Groq达成200亿美元技术许可协议，旨在获得低延迟、高效率的推理技术 [8] - Groq的LPU架构依托SRAM实现极致推理速度，比GPU有望快多倍 [8] - 现有LPUs（如Groq LPU、Cerebras WSE）通过预加载权重或固化数据流，能效较传统CPU、GPU、NPU提升4~20倍 [8] - 中科院计算所与寒武纪团队在ASPLOS2026发表论文，提出硬连线神经语言处理单元（HNLPU）架构 [8] - HNLPU旨在解决硬连线LPU的经济性挑战，通过金属嵌入（Metal-Embedding）方法将权重嵌入金属线3D拓扑，使非经常性工程（NRE）成本进入经济可行范围 [3] - 基于该方法设计的HNLPU在5nm工艺下实现249,960 tokens/s吞吐（是H100的5555倍、WSE-3的85倍），能效为36 tokens/J（是H100的1047倍、WSE-3的283倍），总芯片面积13,232 mm² [9] 公司定位与投资建议 - 公司是国产AI芯片龙头，积极研发新一代智能处理器微架构和指令集 [9] - 公司产品在互联网、运营商、金融、能源等多个重点行业持续落地 [9] - 在LPU发展大趋势下，公司前瞻布局相关技术并取得创新性研究成果（HNLPU），有望在长期内受益于LPU发展大趋势 [9]