投资评级 - 维持“推荐”评级 [2] 核心观点 - 公司发布2025年度业绩预告,预计营收60亿元-70亿元,同比增长410.87%-496.02%,归母净利润18.5亿元-21.5亿元,实现扭亏为盈,扣非归母净利润16亿元-19亿元,业绩大幅增长,收入有望达到预期上限 [7] - 国内头部云厂商(如阿里巴巴)表示将积极投资于人工智能能力提升,国产AI龙头不断加大资本开支并大力推动云业务发展,以寒武纪为代表的国产算力龙头凭借自身在推理等领域的优势,有望充分受益 [7] - 公司生态持续强化,核心竞争力持续提升,包括核心算子与集群能力优化、编译器与调试调优工具优化,这有望成为其长期成长的重要基础 [7] - 公司是国产AI芯片龙头,积极研发新一代智能处理器微架构和指令集,推动智能芯片及加速卡在多个重点行业持续落地,软件生态的持续完善有望进一步提升其在行业内的竞争力,助力长期发展 [8] 业绩与财务预测 - 2025年业绩预告:预计营收60亿元-70亿元,同比增长410.87%-496.02%,归母净利润18.5亿元-21.5亿元,扣非归母净利润16亿元-19亿元 [7] - 2024年对比数据:2024年公司营收11.74亿元,归母净利润-4.52亿元,扣非归母净利润-8.65亿元 [7] - 盈利预测:预计公司2025-2027年归母净利润分别为20.05亿元、36.10亿元、51.04亿元,对应PE分别为265倍、147倍、104倍 [8] - 营收预测:预计公司2025-2027年营业收入分别为63.59亿元、95.37亿元、118.53亿元,增长率分别为441.4%、50.0%、24.3% [8] - 毛利率预测:预计公司2025-2027年毛利率分别为60.4%、63.9%、67.0% [9] - 每股收益预测:预计公司2025-2027年每股收益分别为4.76元、8.56元、12.10元 [8] 技术与生态进展 - 核心算子与集群能力优化:持续打磨核心基础算子的功能、性能与稳定性,高效支撑开源及私有模型在寒武纪智能芯片上稳定运行,例如大规模Embedding Table稀疏访存与计算深度优化,GEMM/BatchGEMM/GroupGEMM等矩阵乘类算子性能泛化能力显著提升,大规模矩阵乘HFU达行业领先水平 [7] - 大规模场景专项优化:新增HDR/DBT等Allreduce通信算法,提升大规模通信带宽,深度优化Alltoall操作,大规模扩展性与国际主流竞品相当,同步强化可维可测能力,支持在线打点、模块化日志、高可靠服务模块 [7] - 通信与延迟优化:通过Kernel层支持RoCE网卡RDMA操作(类IBGDA),显著降低大规模专家并行场景下ALL2ALL通信延迟,提升MoE类模型推理端到端吞吐 [7] - 工具链完善:推出CntrainKit-Accu(大规模集群精度定位工具)、CntrainKit-Monitor(大规模集群监控调优工具)、CNCE(集群监管平台)、CNAnalyzeInsight(故障分析工具)等,为万卡级分布式训练提供全流程支撑 [7] - 编译器与编程模型优化:BANG C语言作为寒武纪BANG异构并行编程模型的核心语言,基于C/C++扩展并适配MLU架构特性,可高效编写并行程序,充分发挥MLU大规模并行计算优势,支持多项编译优化技术,最大化挖掘芯片性能,矩阵乘法等算子效率达行业领先 [7] - 开发语言迭代:持续迭代Triton算子开发语言,全面兼容Triton 3.4特性,支持FP8/FP4数据类型 [7] - 调优工具:在单算子调优方面,CNPerf支持GHz级硬件状态采样,精准记录MLU前后端运行信息,助力用户分析流间/核间同步、算子流水排布等问题,实现硬件后端资源高效利用 [7][8] 行业背景与机遇 - 阿里巴巴表示将“积极”投资于人工智能能力的提升,不排除在已承诺的三年3800亿元人民币投资之外进行额外投资 [7] - 在国产AI龙头不断加大资本开支并大力推动云业务发展的大趋势下,国产算力龙头有望充分受益 [7]
寒武纪(688256):国产算力龙头迎来重要业绩拐点