Workflow
ICMS(InferenceContextMemoryStorage)
icon
搜索文档
闪迪暴涨背后:三大催化共振,NAND成“必需品”,AI 重估存储价值
华尔街见闻· 2026-01-23 11:41
文章核心观点 - AI体系结构演进正驱动存储(特别是NAND闪存)从“成本项”转变为“核心生产要素”,引发行业价值重估,这构成了近期存储板块(如闪迪股价涨幅超100%)上涨的根本原因,而非单纯的周期反弹 [1][10][11] 英伟达的硬件架构革新 - 英伟达CEO黄仁勋在CES 2026提出ICMS(推理上下文内存存储)概念,指出“上下文”正取代算力成为AI新瓶颈,因模型上下文窗口迈向TB级,KVCache等对HBM的挤占难以为继 [1] - 英伟达解决方案是将上下文从HBM卸载至独立存储机架,如在DGX Vera Rubin NVL72 SuperPOD架构中首次引入专用推理存储机架,通过DPU与以太网接入计算体系 [2] - 此架构变化带来显著NAND需求:每个SuperPOD新增NAND约9.6PB,折算至单个NVL72机架增量约1.2PB;若2027年以SuperPOD形态出货10万个NVL72机架,将对应120EB新增NAND需求 [2] - 这部分AI基础设施新增需求,在一个年需求约1.1-1.2ZB的全球NAND市场中,占比接近10%,是结构性新增需求 [3] DeepSeek的算法模型突破 - DeepSeek的Engram模型通过“确定性内存访问”技术,可在计算前根据输入token精确预取所需内存片段,从而有效掩盖SSD与HBM间的延迟差距 [4][5] - 该技术验证了大规模参数可卸载至主机内存:一个1000亿参数规模的嵌入表可完全卸载,且性能损失低于3%;随着模型规模扩大,20-25%的参数天然适合成为“可卸载的静态记忆” [7] - 这使得NAND首次被系统性地纳入分层内存体系,成为AI的“慢速RAM”,承载庞大低频知识库,其战略价值因在模型架构中具备“不可替代性”而被重新定价 [8] ClaudeCode引领的应用层变革 - ClaudeCode的爆发标志着AI从“无状态”对话工具向“有状态”Agent演进,其需要长期工作记忆以支持反复读取修改文件、多轮调试回溯、持续数天的会话状态 [9][12] - 这种“有状态系统”的工作记忆无法长期驻留于昂贵HBM,而BlueField DPU与NAND的组合提供了成本可控的解决方案,使Agent状态常驻NAND层 [9] - 随着AI Agent渗透率提升,存储需求函数将与推理调用次数脱钩,转而与“状态持续时间”挂钩,形成指数级放大的全新增长逻辑 [9] 技术路径汇聚与行业影响 - 三条原本分散的技术路径在2026年初汇聚:英伟达在硬件架构创造新场景,DeepSeek在模型验证可行性,ClaudeCode在应用放大刚性需求,共同构成AI体系结构变化的信号 [10][13] - 存储行业正同时具备周期复苏、长期需求及结构性价值重估三重驱动,其定价逻辑发生跃迁,市场开始重新评估AI时代真正的基础设施 [11]