AI推理工作负载驱动的内存需求变化 - 过去AI基础设施需求主要由大模型训练驱动,但现在推理工作负载正越来越占据主导地位 [4] - 推理过程复杂,涉及从存储加载模型至内存、KV缓存溢出时卸载到存储、以及RAG查询外部数据等环节 [4] AI服务器的内存层次与数据流动 - 典型GPT查询过程涉及HBM、系统DRAM和NVMe NAND闪存三个主要内存层次 [5][6] - 数据流动始于请求到达服务器,若模型未加载则从NVMe SSD读取权重至HBM/DRAM,随后进行Prefill阶段和Token生成 [5][6][7] - 若启用RAG,还需从通常位于NVMe SSD的向量数据库中检索相关上下文 [7] GPT-5推理对各类内存的具体需求估算 - HBM需求主要来自模型权重静态内存和KV缓存动态内存,估算GPT-5推理总需求约为26.8 PB [8][10] - DRAM需求主要来自KV缓存,假设条件下估算2025年GPT-5产生9.13 EB需求,2026年可能翻倍至18.26 EB [8] - NAND需求主要来自RAG,估算2025年GPT-5产生200 EB需求,2026年可能翻倍至400 EB [8] AI推理需求与行业供给对比及市场影响 - 对比行业供给,GPT-5的DRAM和NAND需求在2025年将分别占全球供给的25%和22%,2026年占比将升至43%和39% [9] - 需求集中在下半年可能导致Q3末开始出现供给短缺和价格上涨,传统约20%的年增产率将导致严重短缺,可能形成持续数年的超级周期 [9] - NAND市场因AI推理需求(如用于近线SSD)从供过于求转向缺货,云服务商提前至8月谈判明年订单,需求强度超预期 [11] - NAND价格预计2025年Q4上涨近10%,2026年上半年可能再涨15-20% [11] 产业链相关公司分析 - KIOXIA作为纯NAND厂商对涨价弹性最大,但负债高和日元升值是风险 [12] - SanDisk是消费级SSD龙头,企业级业务在增长,其每股收益在牛市可能超过10美元 [12][13] - 三星和SK海力士能同时受益于HBM和NAND需求,实现AI内存全覆盖,但估值已部分反映利好 [12] - 模组厂如群联和江波龙作为中间商,利润取决于价差,但没有晶圆制造能力 [12] - 一家未具名公司是DRAM和NAND芯片下方BT基板材料的独家供应商,拥有100%市场份额 [9]
AI大语言模型如何带来内存超级周期?
傅里叶的猫·2025-10-14 23:51