Workflow
内存分层技术
icon
搜索文档
天下苦DRAM久矣
半导体行业观察· 2026-07-05 10:39
核心观点 - 数据中心正面临由AI业务扩张引发的内存(DRAM)资源危机,价格暴涨与供给刚性成为制约AI算力部署的关键因素[1] - DRAM价格飙升的根源在于HBM(高带宽内存)对产能的持续蚕食,且产能扩张速度远低于AI需求增长速度[2] - 行业正通过多种技术路径重构AI推理的内存层级,旨在减少对昂贵DRAM的依赖,将温冷数据下沉至成本更低的NAND闪存,以平衡性能与成本[27] DRAM危机现状与成因 - **价格暴涨**:64GB DIMM内存价格在2025年第三季度至2026年第一季度间上涨3.5倍,预计到2026年第三季度累计涨幅达5倍[1]。2026年第一季度DRAM合约价季增幅度高达93%至98%,第二季度预计再涨58%至63%[1] - **成本高企**:服务器级DDR5 RDIMM现货单价达每GB 27至37美元,搭建一个12TB内存池的纯DRAM硬件采购成本接近50万美元[1][22] - **供给短缺**:HBM在DRAM晶圆产能中的占比从2020年的2%攀升至2026年预估的25%[2]。2025至2027年,HBM投片量占整体DRAM投片量的比例分别为18%、22%和约30%[2]。一片HBM晶圆消耗约三片DDR5的产能[2] - **产能扩张缓慢**:先进DRAM制程依赖昂贵的EUV光刻机(单台约2亿美元),晶圆厂建设周期长达数年,产能扩张速度远不及AI需求增长[2] - **供需失衡预测**:不计国产厂商影响,2026年全球存储bit供给增长仅为7%至8%,DRAM与NAND合计可能出现约15万至20万片/月的供给缺口[3] - **影响范围扩大**:内存成本上涨已从数据中心蔓延至消费端,如Xbox因内存成本两年上涨约五倍而无法生产足够游戏主机,苹果也对多款产品涨价[3] - **成本占比剧增**:在服务器物料清单中,DRAM成本占比从2023年的约50%攀升至2026年年中的60%至90%,平均约75%[3] - **利用率低下**:Meta等厂商实测数据显示,数据中心内存普遍仅有约一半容量承载活跃的“热数据”[4] 行业技术解决方案 AMD:AI预测调度与软件分层 - AMD通过收购MEXT公司,引入基于AI的内存分层技术,将冷数据从DRAM下沉至NAND闪存[5] - MEXT的预测内存引擎以内存页为粒度监测访问模式,通过AI模型预测并预取数据,对应用和操作系统透明[7] - 该方案可将系统有效内存容量提升2至4倍,基础设施整体成本下降约50%[9]。在Neo4j图数据库等场景中,DRAM与闪存1:1配置可达纯DRAM约95%的吞吐量[9] - 成本节省示例:在戴尔服务器上,1.5TB内存配置成本从9.9万美元降至3万美元,节省70%;在AWS上,1TB月度成本从8145美元降至4413美元(节省46%)或2719美元(节省67%)[9] Apple:端侧大模型与闪存存储 - 苹果通过稀疏激活架构,将200亿参数的AFM 3 Core Advanced端侧大模型完整存放在NAND闪存中,推理时仅将10亿到40亿参数的工作集调入DRAM[14] - 采用按提示词粒度的路由机制,配合高比例常驻DRAM的共享专家,减少数据交换次数,将DRAM峰值占用控制在2GB至8GB区间[17] - 该技术基于此前《LLM in a Flash》论文研究,可在CPU和GPU上分别实现比朴素加载快4至5倍和20至25倍的推理速度[18] Marvell:硬件压缩与CXL内存扩展 - Marvell发布Structera系列CXL控制器,内置硬件压缩模块,通过定制化LZ4算法对数据进行实时压缩/解压,对应用透明且不占用主机CPU算力[21] - 根据数据类型,1GB物理DRAM可发挥2至3.64倍的等效逻辑容量,混合数据库场景平均压缩比达3.64:1[21] - 方案支持将退役的DDR4内存纳入CXL内存池,并实现多服务器内存池化,优化资本开支[22] - 以12TB内存池为例,按3倍压缩比估算,物理DRAM采购量可缩减三分之二,节省三十余万美元[22] 闪迪:高带宽闪存与封装创新 - 闪迪联合SK海力士推动高带宽闪存标准化,提出将高容量NAND闪存堆叠在GPU下方的“GPU下的NAND”架构,缩短数据传输距离[23] - HBF目标容量为同体积HBM的8至16倍,成本具备显著优势,定位介于HBM和SSD之间,主打读取密集型场景[23] - 双方计划在2026年下半年推出首批HBF样品,2027年初应用于AI推理设备,目标构建HBM、HBF、SSD三级内存架构[24] - 据韩国新荣证券预计,HBF市场有望在2027年形成,到2030年增长至120亿美元规模[25] 历史对照与行业影响 - **3D XPoint的教训**:英特尔与美光曾推出的3D XPoint技术,因成本追平DRAM而性能仅比闪存快数倍,加之封闭策略,最终项目终止[26] - **行业方向**:多种技术路径共同指向AI推理内存层级的重构,热数据留于DRAM/HBM,温冷数据下沉至闪存,形成多层存储架构协同[20][27] - **传导效应**:内存层级重构将沿产业链产生传导效应,NAND原厂等环节可能直接受益[20]