报告行业投资评级 * 报告未明确给出“买入”、“增持”等具体行业投资评级,但其核心观点和投资建议部分对存储行业在AI驱动下的前景持积极乐观态度 [7] 报告核心观点 * AI推理成为存储需求爆发的核心驱动力,并驱动存储范式升级:存储是AI推理的核心瓶颈,LLM推理的解码阶段本质是memory-bound,KV Cache等动态张量数据加剧了内存墙问题,提升存储带宽和容量是增强推理性能、降低成本的必然趋势 [5][7] * 行业供需持续紧张,周期能见度拉长:在前期价格大幅上涨后,市场关注点从“价格还能涨多少”转向“价格高位保持多久”,预计合约价在2026年全年上涨,2027年至少保持高位,客户与原厂签订3-5年长协拉长了周期能见度 [7] * 存储是AI硬件板块中短期业绩确定性最强、估值最低的方向:服务器占存储需求敞口已提升至50%-60%,存储是AI推理的核心瓶颈环节,同时是AI硬件中短期业绩确定性最强、估值最低的方向 [7] 分章节总结 AI推理带来存储需求爆发和存储范式的改进 * AI训练与推理对存储需求存在显著区别:训练是计算密集型,存储总需求约为推理的100-1000倍,需保存海量训练数据、检查点等;推理是延迟敏感型,核心存储负载包括模型权重、KV Cache等,其中KV Cache是显存消耗的核心因素,会随序列长度动态扩展 [13][16] * 从AI平台维度看,推理的存储需求占比将快速提升并远超训练:随着AI从“生成式”向“智能体AI”迈进,用户数爆发式增长,KV Cache规模快速膨胀,预计到2030年,数据中心中推理存储需求占比将超过70% [13][18] * 大模型推理的主要存储负载包括模型权重和KV Cache:模型权重为静态张量数据,例如INT8精度下7B模型约占用7GB存储空间;KV Cache是动态膨胀的张量数据,是推理侧显存占用与带宽消耗的核心决定因素,其规模随Batch Size、上下文长度及并发请求数线性增长 [25][27] * AI推理驱动存储需求指数级爆发:KV Cache多层缓存成为推理系统“标配”,带动HBM、DRAM、SSD配置同步放大;对话范式从模型自答升级到思维链、多Agent协作,单次复杂任务的token消耗存在10倍量级上行空间;媒介从文本升级到多模态(尤其视频),进一步提升了存储需求 [28][30][33] * 大模型推理性能瓶颈从算力约束转向内存约束:在传统冯·诺依曼架构下,数据在处理器与存储之间频繁搬运形成“内存墙”瓶颈,黄仁勋指出“GPU大部分时间都在等数据”,解码(Decode)阶段受限于存储带宽与访存延迟 [7][36][45] * 提升存储带宽和容量可显著增强推理性能、降低成本,“以存代算”是趋势:英伟达H200相比H100,HBM容量提升76%至141GB,带宽提升43%至4.8TB/s,在处理Llama-2-70B模型时,推理吞吐量翻倍(从~60 tokens/秒提升至120+ tokens/秒),延迟降低约50%,每次推理成本降低68% [55][56] * 产业界从模型和硬件双线推进存储范式改进:模型层面通过权重量化、GQA/MQA注意力机制、PagedAttention分页调度等技术优化;硬件层面通过发展HBM、WOW 3D堆叠DRAM、HBF(高带宽闪存)提升带宽,通过CXL内存池化、Prefill与Decode物理分离部署(如英伟达Dynamo架构)优化存储层级和管理系统 [58][66][94] 看未来2年供需持续紧张,原厂与客户签订长协 * 存储需求结构从消费电子主导转向服务器主导:2026年,在存储器下游需求中,服务器占比有望提升至40%左右;在DRAM下游需求中,服务器占比(含HBM)有望提升到50%-60%,而手机+PC需求占比降至40%以下 [100] * 服务器成为存储需求最强驱动力:2021-2026E,手机和PC出货量CAGR分别为-4%和-7%,需求增长主要靠单机容量提升;同期服务器出货量CAGR为+5%,且单机DRAM容量CAGR达+14%,单机NAND容量CAGR达+27% [102][103] * 存储价格上涨显著推高终端设备成本:在存储涨价周期下,低端手机(<$200)的存储成本占总价比例从2025年中的约11%提升至2026年4月的55%;中端手机($400-600)该比例从2025年Q4的16%预计提升至2026年Q2的36%;高端手机(>$800)从20%预计提升至41% [105][108] * PC设备存储成本占比也大幅提升:以AI轻薄本($800)和游戏本($1100)为例,从2025年10月到2026年初,存储总成本占整机价格的比例均从约10%提升至29% [112][113] 存储是AI硬件估值最低、业绩确定性最强的方向 * 报告认为存储板块在AI硬件中具备比较优势:服务器占存储需求敞口已提升至50%-60%,存储是AI推理的核心瓶颈环节,同时是AI硬件中短期业绩确定性最强、估值最低的方向 [7] 投资建议 * 报告建议关注四大方向:1)弹性模组及主控公司,如德明利、江波龙等;2)存储芯片设计公司,如兆易创新、北京君正等;3)半导体设备公司,如北方华创、中微公司等;4)光刻机产业链公司,如茂莱光学、富创精密等 [7]
中泰电子存储:AI推理带来需求爆发、驱动范式升级,周期能见度大幅拉长
中泰证券·2026-05-16 19:30