中信证券:AI推理带动存储需求爆发 持续看好存储创新成长趋势
智通财经网·2026-03-30 10:05

行业核心观点 - 存储行业正迎来由Agent AI驱动的长周期范式转移,存力成为核心,行业进入超级成长阶段,而非周期性反弹 [1][3] 供需格局与价格展望 - 需求端:AI推理阶段导致Token消耗剧增,KV Cache占用随序列长度和并发量线性暴涨,例如序列长度从1k升至128k token时,KV Cache占用从0.5GB提升至64GB (BF/FP16, 单请求) [1][2];AI服务器在整体服务器出货中占比将突破20% [2];HBM容量预计2025年同比+90%,2026年同比+35%以上 [2];KV Cache下沉及HDD短缺驱动企业级SSD成为2026年NAND最大下游,占比提升至37% [2] - 供给端:原厂将先进产能优先投入高毛利的AI存储产品,高端DRAM(含HBM/DDR5/LP5X/6)产能占比从2024年不到50%提升至2026年的85%+,成熟制程与消费级产能被挤压 [3];行业库存从2023年1012周、2024年810周,降至2026年的4周,低于历史安全线 [3] - 价格与周期:存储扩产周期长达18~24个月,2026年下半年不可能出现供给拐点,缺货可能持续至2027年 [3];存储价格自2025年下半年起迎来史诗级上涨,预计DRAM和NAND ASP将在2026全年保持上涨 [3] 产业链价值重构 - 英伟达提出的“Token工厂经济学”强化了存储在AI基础设施中的战略地位,打开了产业盈利天花板 [4] - 企业级SSD产品ASP在2026年第一季度已达消费级NAND ASP的2倍以上 [4] - 存储原厂核心在于介质升级及系统架构级重构,焦点转向企业级市场 [4] - 存储解决方案厂商从价格竞争转向供货能力竞争,并向“客制化高附加值模组”及企业级SSD转型,以重新定义存储价值 [4] AI云端(企业级)存储技术趋势 - 背景:AI从训练走向推理,推理与训练服务器比例预计将高达10:1至50:1 [5];当前GPU集群利用率仅约46%至50%,受制于存储带宽瓶颈 [5] - 角色转变:企业级SSD从“被动的数据容器”跃升为“算力引擎”与“扩展内存层”,通过分层缓存KV Cache提升效率,实测将KV缓存卸载至SSD可将首token生成时间降低41倍 [5] - 大容量QLC爆发:成为应对海量AI数据与KV Cache缓存外溢需求的关键介质,铠侠(245.76TB)、大普微(245TB)、闪迪(256TB方案)等均推出两百TB级别超大容量QLC产品 [6] - 主控芯片升级:针对推理场景高频随机读写压力,主控向“软硬协同”与“智能资源调度器”演进,例如平头哥镇岳510累计出货超50万片,联芸科技引入KV加速引擎 [6] - 接口与散热创新:为适配十万卡GPU超大集群,三星展示16通道PCIe 6.0固态硬盘PM1763,输入/输出性能提升2.0倍;FADU的PCIe Gen6主控“Lhotse”顺序读性能将达28.5GB/s [6] AI终端(消费级)存储技术趋势 - 核心路径:通过“存算融合”、软硬件智能调度及高级缓存技术,将推理压力从DRAM向NAND转移,以突破端侧部署瓶颈 [7] - AI PC与本地大模型:采用混合技术降低DRAM需求,江波龙方案在PC上实现397B模型本地部署,并在256K上下文场景下降低近40%的DRAM占用;群联电子方案预计可减少超50%的DRAM使用量 [7] - 智能汽车与边缘计算:向中央池化架构与统一平台底座发展,车规LPDDR6时代即将到来,车载NAND存储从分域孤岛走向中央池化与软件定义 [7] - 智能手机与AIoT物联网:追求高速接口与低功耗,慧荣科技即将推出新一代UFS 4.1主控SM 2755;闪迪采用SmartSLC缓存技术在约2W功耗下实现UFS 4.1高吞吐量;江波龙推动HLC高级缓存技术在嵌入式端落地以降低成本 [8]

中信证券:AI推理带动存储需求爆发 持续看好存储创新成长趋势 - Reportify