Workflow
LPU架构
icon
搜索文档
寒武纪:2025 年业绩快报点评LPU引领推理算力创新,国产算力龙头新机遇可期-20260228
国联民生证券· 2026-02-28 18:25
报告投资评级 - 维持“推荐”评级 [4][8][9] 报告核心观点 - 公司是国产AI芯片龙头,2025年业绩迎来重要拐点,实现扭亏为盈,并有望在LPU(语言处理单元)发展大趋势下,凭借前瞻性技术布局和创新研究成果,长期受益于AI推理算力需求增长 [8][9] 2025年业绩表现 - **营业总收入**:2025年实现64.97亿元,同比增长453% [8] - **归母净利润**:2025年实现20.59亿元,上年同期为-4.52亿元,实现扭亏为盈 [8] - **扣非归母净利润**:2025年实现17.70亿元,上年同期为-8.65亿元 [8] - **第四季度业绩**:2025Q4归母净利润4.5亿元,同比增长67%;扣非归母净利润3.5亿元,上年同期约为-250万元 [8] - **业绩增长原因**:受益于人工智能行业算力需求持续攀升,公司凭借产品竞争力拓展市场,推动AI应用场景落地,带动收入规模大幅增长 [8] 行业趋势与技术创新 - **LPU架构重要性提升**:2025年12月,英伟达与AI推理芯片公司Groq达成200亿美元技术许可协议,旨在获取其低延迟、高效率的LPU推理技术,以加深平台护城河 [8] - **LPU性能优势**:现有LPUs(如Groq LPU、Cerebras WSE)通过预加载权重或固化数据流,能效较传统CPU、GPU、NPU提升4~20倍 [8] - **行业能耗挑战**:预计到2028年美国AI数据中心将占用12%的总电力容量,核心原因是当前LPUs和GPU在自回归解码中反复调取千亿级权重参数,导致功耗提升 [3] - **硬连线LPU创新**:为从根本上解决能耗问题,需将LPU专用化推向极致,提出硬连线LPU(Hardwired LPU),通过将权重参数物理硬连线到计算架构中,实现架构与模型完美匹配、零参数调取开销及极致计算效率 [3] - **技术挑战与突破**:直接硬连线GPT-OSS 120B模型在5nm工艺下需要176,000mm²的CMAC阵列,经济性存挑战;论文提出“金属嵌入”方法,将权重嵌入金属线3D拓扑,使硬连线LPU的非经常性工程成本进入经济可行范围 [3] - **公司研究成果**:中科院计算所与公司团队在ASPLOS2026发表的论文提出了硬连线神经语言处理单元(HNLPU)架构 [8] - **HNLPU性能数据**:在5nm工艺下,HNLPU实现249,960 tokens/s的吞吐量,是英伟达H100的5555倍、Cerebras WSE-3的85倍;能效达到36 tokens/J,是H100的1047倍、WSE-3的283倍;总芯片面积为13,232mm² [3][9] 财务预测与估值 - **营业收入预测**:预计2025-2027年营业收入分别为64.97亿元、95.37亿元、118.53亿元 [9] - **归母净利润预测**:预计2025-2027年归母净利润分别为20.59亿元、36.28亿元、51.28亿元 [9] - **每股收益预测**:预计2025-2027年EPS分别为4.88元、8.60元、12.16元 [9] - **市盈率预测**:对应2025-2027年PE分别为241倍、137倍、97倍 [9] - **毛利率趋势**:预计毛利率从2024年的56.7%持续提升至2027年的67.0% [10] - **净资产收益率**:预计ROE从2025年的13.24%提升至2027年的22.69% [10]
华尔街日报:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计
美股IPO· 2026-02-28 16:04
文章核心观点 - 英伟达计划推出整合Groq LPU技术的新型推理芯片,并已为Meta大规模部署纯CPU方案,旨在应对AI行业从训练向推理部署转移的趋势,通过多元化硬件组合巩固其市场地位 [1][3][6][7] GTC大会新品发布与LPU技术整合 - 公司计划在下月GTC开发者大会上发布一款整合Groq“语言处理单元”(LPU)技术的全新推理芯片,首席执行官黄仁勋称其为“世界从未见过”的全新系统 [3] - 该芯片专为加速AI模型的查询响应而设计,预计将重塑当前AI算力市场格局,直接影响云服务提供商和企业级投资者 [3] - 新产品可能基于具备颠覆性的下一代Feynman架构,该架构可能采用更广泛的SRAM集成方案,甚至通过3D堆叠技术深度整合LPU,专门针对延迟和内存带宽两大推理瓶颈进行优化 [1][5] - 公司去年底斥资200亿美元获得了Groq的关键技术许可,并吸纳了包括创始人Jonathan Ross在内的高管团队 [5] 市场认可与客户动向 - OpenAI已同意成为新处理器的最大客户之一,宣布将向英伟达购买大规模的“专用推理产能”,这一举动稳固了公司核心客户盘 [3] - OpenAI的承诺采购与投资总额达300亿美元 [1] - OpenAI同时也在寻求其他供应商,例如与初创公司Cerebras达成了一项价值数十亿美元的计算合作,并与亚马逊签署了使用Trainium芯片的重大协议 [7] 战略调整:纯CPU部署方案 - 公司在引入LPU架构的同时,也在灵活调整其传统处理器的使用方式,本月宣布扩大与Meta Platforms的合作,进行了首次大规模的纯CPU部署,以支持Meta的广告定向AI智能体 [1][6] - 此举表明公司正超越单一的GPU销售模式,试图通过多元化的硬件组合来锁定AI市场的不同细分领域 [6] - 部分大型企业客户发现,在处理某些特定的AI智能体工作负载时,纯CPU环境比将Vera CPU与Rubin GPU捆绑的成本更低且能效更高 [6] 行业背景与竞争态势 - AI行业正从模型训练向实际应用部署转移,推理计算成为核心焦点,大型AI模型的解码过程尤其缓慢 [4] - 许多构建和运营AI智能体的公司发现,传统的GPU成本过于昂贵,且在实际运行模型时并非最佳选择 [7] - 主要云服务商在加紧自研芯片,例如Anthropic Claude Code主要依赖亚马逊AWS和Alphabet旗下谷歌云设计的芯片 [7] - 面对竞争,公司强调正从单纯的芯片供应商向涵盖半导体、数据中心、云和应用的完整AI生态系统构建者转型 [7] - 下月的GTC大会将是检验公司能否在推理时代延续其90%市场份额神话的关键节点 [7]
寒武纪(688256):2025 年业绩快报点评:LPU引领推理算力创新,国产算力龙头新机遇可期
国联民生证券· 2026-02-28 15:54
报告投资评级 - 维持“推荐”评级 [4][9] 核心业绩与财务表现 - 2025年度实现营业总收入64.97亿元,同比增长453% [8] - 2025年度实现归母净利润20.59亿元,上年同期为-4.52亿元,实现扭亏为盈 [8] - 2025年第四季度归母净利润4.5亿元,同比增长67%;扣非归母净利润3.5亿元,上年同期约为-250万元 [8] - 业绩大幅增长核心原因为人工智能行业算力需求持续攀升,公司产品竞争力强,积极推动应用场景落地 [8] - 预计公司2025-2027年营业收入分别为64.97/95.37/118.53亿元,归母净利润为20.59/36.28/51.28亿元 [9] - 预计2025-2027年每股收益(EPS)分别为4.88/8.60/12.16元,对应市盈率(PE)分别为241倍、137倍、97倍 [9] - 2025年毛利率预计为60.4%,并预计在2026年、2027年进一步提升至63.9%和67.0% [10] 技术创新与行业趋势 - 现有AI基础设施面临高能耗问题,预计到2028年美国AI数据中心将占用12%总电力容量 [3] - LPU(语言处理单元)架构是重要发展趋势,英伟达与Groq达成200亿美元技术许可协议,旨在获得低延迟、高效率的推理技术 [8] - Groq的LPU架构依托SRAM实现极致推理速度,比GPU有望快多倍 [8] - 现有LPUs(如Groq LPU、Cerebras WSE)通过预加载权重或固化数据流,能效较传统CPU、GPU、NPU提升4~20倍 [8] - 中科院计算所与寒武纪团队在ASPLOS2026发表论文,提出硬连线神经语言处理单元(HNLPU)架构 [8] - HNLPU旨在解决硬连线LPU的经济性挑战,通过金属嵌入(Metal-Embedding)方法将权重嵌入金属线3D拓扑,使非经常性工程(NRE)成本进入经济可行范围 [3] - 基于该方法设计的HNLPU在5nm工艺下实现249,960 tokens/s吞吐(是H100的5555倍、WSE-3的85倍),能效为36 tokens/J(是H100的1047倍、WSE-3的283倍),总芯片面积13,232 mm² [9] 公司定位与投资建议 - 公司是国产AI芯片龙头,积极研发新一代智能处理器微架构和指令集 [9] - 公司产品在互联网、运营商、金融、能源等多个重点行业持续落地 [9] - 在LPU发展大趋势下,公司前瞻布局相关技术并取得创新性研究成果(HNLPU),有望在长期内受益于LPU发展大趋势 [9]