Workflow
内存超级周期
icon
搜索文档
AI大语言模型如何带来内存超级周期?
傅里叶的猫· 2025-10-14 23:51
AI推理工作负载驱动的内存需求变化 - 过去AI基础设施需求主要由大模型训练驱动,但现在推理工作负载正越来越占据主导地位 [4] - 推理过程复杂,涉及从存储加载模型至内存、KV缓存溢出时卸载到存储、以及RAG查询外部数据等环节 [4] AI服务器的内存层次与数据流动 - 典型GPT查询过程涉及HBM、系统DRAM和NVMe NAND闪存三个主要内存层次 [5][6] - 数据流动始于请求到达服务器,若模型未加载则从NVMe SSD读取权重至HBM/DRAM,随后进行Prefill阶段和Token生成 [5][6][7] - 若启用RAG,还需从通常位于NVMe SSD的向量数据库中检索相关上下文 [7] GPT-5推理对各类内存的具体需求估算 - HBM需求主要来自模型权重静态内存和KV缓存动态内存,估算GPT-5推理总需求约为26.8 PB [8][10] - DRAM需求主要来自KV缓存,假设条件下估算2025年GPT-5产生9.13 EB需求,2026年可能翻倍至18.26 EB [8] - NAND需求主要来自RAG,估算2025年GPT-5产生200 EB需求,2026年可能翻倍至400 EB [8] AI推理需求与行业供给对比及市场影响 - 对比行业供给,GPT-5的DRAM和NAND需求在2025年将分别占全球供给的25%和22%,2026年占比将升至43%和39% [9] - 需求集中在下半年可能导致Q3末开始出现供给短缺和价格上涨,传统约20%的年增产率将导致严重短缺,可能形成持续数年的超级周期 [9] - NAND市场因AI推理需求(如用于近线SSD)从供过于求转向缺货,云服务商提前至8月谈判明年订单,需求强度超预期 [11] - NAND价格预计2025年Q4上涨近10%,2026年上半年可能再涨15-20% [11] 产业链相关公司分析 - KIOXIA作为纯NAND厂商对涨价弹性最大,但负债高和日元升值是风险 [12] - SanDisk是消费级SSD龙头,企业级业务在增长,其每股收益在牛市可能超过10美元 [12][13] - 三星和SK海力士能同时受益于HBM和NAND需求,实现AI内存全覆盖,但估值已部分反映利好 [12] - 模组厂如群联和江波龙作为中间商,利润取决于价差,但没有晶圆制造能力 [12] - 一家未具名公司是DRAM和NAND芯片下方BT基板材料的独家供应商,拥有100%市场份额 [9]
美股鲍威尔一句话“吓坏”华尔街,美光财报释放重磅信号
36氪· 2025-09-24 09:30
宏观经济与市场反应 - 美联储主席鲍威尔发表评论称美股价格估值相当高,市场将此解读为对高估值的公开警示[3] - 鲍威尔强调经济道路崎岖且存在风险,未对降息做出承诺,表态为边走边看[4] - 此番言论导致市场情绪迅速从狂欢切换至紧张,美股三大指数应声转跌[4] - 标普500指数收盘下跌0.6%,道指下跌0.2%,纳指下跌1%[6] - 对利率敏感的科技股率先遭受打击,亚马逊领跌3.04%,英伟达跌2.82%,特斯拉跌1.93%[5] 美光科技财报表现 - 美光科技第四季度营收达到113亿美元,高于市场预期的112亿美元[10] - 第四季度每股收益为3.03美元,远超分析师预测的2.84美元[10] - 公司对2026年第一季度营收指引高达125亿美元,每股利润预计3.75美元,大幅超出预测[10] - 公司CEO强调其拥有目前最具竞争力的产品组合以及作为美国本土唯一内存制造商的独特地位[9] AI驱动的内存超级周期 - AI正在引爆内存超级周期,AI数据中心对内存和NAND闪存的需求持续增长[8][9] - 内存芯片供应紧张局面预计将持续到明年,行业来不及生产[9] - AI的巨大需求正在颠覆传统供需关系,让芯片制造商掌握前所未有的定价权[14] - 美光宣布2026年大部分HBM3e芯片已签订价格协议,提前锁定高价值产品收入[12] 半导体行业趋势与竞争格局 - 美光在下一代HBM芯片上布局领先,已开始提供HBM4芯片样品[12] - 公司将通过提高价格来抵消外包给台积电生产HBM4E晶圆的更高成本,以维持利润率[12] - 台积电透露其2nm制程价格将比3nm至少上涨50%,旗舰芯片单价可能高达280美元[15] - 苹果已将台积电2nm产能的预订份额提高到50%以上,可能导致高通和联发科等竞争对手面临供应难题[15] - 存储芯片全线涨价,三星和SK海力士已上调内存和闪存产品价格,DRAM产品涨幅高达30%[15]