东方证券:英伟达推出推理上下文内存存储平台 AI存储需求持续扩张
智通财经网·2026-01-07 15:38

英伟达发布AI推理存储平台 - 英伟达在CES 2026大会上发布推理上下文内存存储平台 这是一个POD级AI原生存储基础设施 核心目标是在GPU内存和传统存储之间创建一个专为推理优化的新型内存层 以支撑AI长期运行 [1][2] - 该平台是硬件与软件协同设计的结果 包括BlueField-4 DPU负责硬件加速数据管理 Spectrum-X以太网提供高性能网络 以及DOCA等软件组件优化系统调度 [2] - 该平台可将原本放在GPU内存里的上下文数据扩展到一个独立、高速、可共享的“记忆层”中 从而释放GPU压力并在多个节点与AI智能体间快速共享信息 [2] - 英伟达表示 使用该平台可以让每秒处理的token数提升最高达5倍 并实现同等水平的能效优化 [2] AI推理瓶颈转变与存储需求 - 英伟达CEO黄仁勋强调 AI推理瓶颈正从计算转向上下文存储 随着模型规模与使用量提升 处理复杂任务会产生大量上下文数据 传统网络存储效率过低 AI存储架构需要重构 [3] - AI大模型推理过程需要高频次访问数据以实现高质量内容生成 这将使存储结构发生较大变化 提升对存储芯片的需求 [1][3] - AI有望从“一次性对话的聊天机器人”演进为持续推理的智能协作体 这需要持续扩大上下文容量并加快跨节点共享 从而带动存储芯片需求高速成长 [3] 存储行业供需与国产化机遇 - 当前存储供不应求持续 同时海外存储巨头在通用存储方面的扩产进度可能有限 这为国内存储厂商扩产、提升份额带来历史性机遇 [1][4] - 技术方面 在DRAM领域 长鑫科技于2025年11月推出DDR5产品 在峰值速率等主流技术参数上达到国际一线水平 在NAND领域 长江存储自主研发的Xtacking架构实现了3D NAND技术的跨越式发展 [4] - 融资与扩产方面 长鑫科技IPO已获受理 长江存储的母公司长存集团于2025年9月完成股份制改革 两存未来推进融资后有望实现较大的扩产体量 产业链上下游有望深度受益 [4] 相关受益标的 - 国内半导体设备企业包括 中微公司(688012.SH) 精智达(688627.SH) 京仪装备(688652.SH) 微导纳米(688147.SH) 拓荆科技(688072.SH) 北方华创(002371.SZ) [5] - 国内封测企业包括 深科技(000021.SZ) 汇成股份(688403.SH) 通富微电(002156.SZ) [5] - 配套逻辑芯片厂商包括 晶合集成(688249.SH) [6] - 布局端侧AI存储方案的厂商包括 兆易创新(603986.SH) 北京君正(300223.SZ) [6] - 受益存储技术迭代的厂商包括 澜起科技(688008.SH) 联芸科技(688449.SH) [6] - 国产存储方案厂商包括 江波龙(301308.SZ) 德明利(001909.SZ) 佰维存储(688525.SH) 联想集团(00992) [6]