Workflow
AI存储,再度爆火

文章核心观点 - AI的飞速发展使存储成为与算力同等重要的关键环节,HBM、HBF和GDDR7三种存储技术正在重新定义AI基础设施的未来格局 [1] - 这三种技术的竞合演进关乎存储产业数千亿美元的市场格局,并决定着人工智能能否突破当前技术天花板,迈向通用人工智能新纪元 [1] - 没有一种存储技术能够包打天下,HBM、HBF、GDDR7在特定领域发挥着不可替代的作用,反映出AI产业对存储需求的多样化和精细化 [23] HBM(高带宽内存)技术发展 - HBM通过3D堆叠技术实现超高带宽存储,已成为决定AI芯片性能上限的关键因素,从H100的80GB容量、3.4TB/s带宽提升到GB300的288GB容量、8.0TB/s带宽,不到三年实现容量超两倍、带宽约2.5倍的提升 [3] - SK海力士凭借技术和市场双重优势稳居霸主地位,已进入HBM4最终测试阶段并向英伟达供应样品,同时宣布完成下一代HBM4内存开发并具备全球首个大规模量产条件 [3] - 三星电子在HBM4性能方面有信心,采用4纳米代工工艺应用于逻辑芯片,但测试进度落后竞争对手约两个月,在快速迭代的AI市场中可能造成致命影响 [3] - HBM正向定制化(cHBM)发展,SK海力士已锁定英伟达、微软、博通等重量级客户开展定制设计,从第七代HBM(HBM4E)开始将全面转向定制化路线 [4] - 定制化HBM的核心在于将基础芯片功能集成进由SoC团队设计的逻辑芯片中,赋予设计人员更大灵活性,可更紧密集成内存与处理器芯片,并根据具体应用优化功耗、性能与面积 [4] - 三星电子发起“背水一战”,在董事长李在镕支持下为HBM业务投入全部精力,正量产HBM4样品,产量约为10,000片晶圆,采用尚未完全成熟的10nm级第六代(1c)DRAM技术 [5][6] - 三星采用激进定价策略,业内估计12层HBM4价格将比HBM3E高出60-70%,但三星正考虑低于20%的溢价,同时加速建设平泽第五工厂配备10纳米第六代DRAM生产线,专门用于批量生产HBM4 [6] HBF(高带宽闪存)技术前景 - HBF是将NAND闪存层叠而成的产品,利用NAND闪存特性实现更大存储容量,试图在带宽与容量之间找到新平衡点,满足AI基础设施对存储需求的指数级增长 [8] - 美国闪存企业Sandisk今年2月宣布正在开发HBF技术,将其定位为“结合3D NAND容量和HBM带宽”的创新产品,能够同时满足带宽、容量、低功耗的综合要求 [8] - HBF技术路线的提出源于AI模型向多模态、长上下文方向发展,需要处理海量中间状态数据,传统DRAM容量扩展成本高,NAND闪存访问速度慢,HBF试图通过架构创新找到最优解 [8] - Sandisk与SK海力士签订开发HBF的谅解备忘录,计划明年下半年向客户提供样本,2027年初为推理AI提供正式产品,此消息推动Sandisk股价从43美元飙升至86美元,翻了一番 [9] - HBF技术实现面临挑战,NAND闪存访问速度远低于DRAM,若CPU将基于NAND的存储当作主存使用,运算速度必然大幅下降,需要能够一次性处理和传输大规模信息的软件和基础设施支持 [9][10] - HBF和HBM并非竞争关系而是互补,HBF更适合需要超大容量的特定应用场景,如视频生成模型Sora需要处理数TB中间数据,HBF通过牺牲部分带宽换取更大容量满足这类需求 [10] - HBF在成本控制方面具有潜在优势,NAND闪存每GB成本远低于DRAM,在需要大容量但对带宽要求相对宽松的应用场景中具有明显经济性 [11] GDDR7技术应用与市场 - 英伟达推出Rubin CPX GPU采用128GB GDDR7显存而非更高端HBM4,体现对AI推理架构的新思考,提出“解耦推理”理念将推理过程拆分为上下文阶段和生成阶段 [13] - 在该架构下,Rubin CPX承担上下文构建任务,GDDR7带宽和延迟已完全足够,生成阶段工作交由配备HBM4的标准Rubin GPU执行,避免资源浪费并优化成本 [13] - HBM在加速器BOM中已成为最昂贵单一组件,从Hopper到Blackwell成本占比不断攀升,合理配置不同类型存储成为优化成本的关键 [13] - 英伟达为RTX Pro 6000下达大量GDDR7订单主要由三星承接,近期要求三星将GDDR7产量翻倍,三星扩大生产设施并增加材料与组件,预计本月启动扩产后的供应链 [14] - 英伟达准备推出代号“B40”新产品搭载三星GDDR7针对中国市场销售,通过降低数据处理能力规避出口限制,预计今年出货量可能达到100万片,仅GDDR7基板需求就高达约2000亿韩元 [14] - GDDR7的采用是成本优化选择,可能成为AI推理普及化的重要推手,通过大幅降低显存在系统总成本中的比重,使更多企业能够负担AI推理基础设施 [15] - 当token成本显著下降,用户对推理需求会激增,需求增长往往远远抵消成本下降影响,推动整个市场规模持续扩大,整体市场对高端HBM需求可能因应用普及而进一步增长 [15] 行业活动信息 - 2025年湾区半导体产业生态博览会(湾芯展)将于10月15—17日在深圳会展中心举办,展会规模扩容50%,展示面积突破60,000平方米,汇聚600+全球头部企业,预计吸引60,000名专业观众 [17] - 湾芯展将重点展示HBM、HBF、GDDR7等前沿存储技术及其在AI算力中心、智能汽车、超算平台中的应用突破,国内外存储巨头与创新企业将带来最新产品与解决方案 [18] - 展会首创“项目采购展”模式和全年服务体系,贯穿展前精准匹配、展中高效对接、展后持续跟进,推动百亿级产业合作落地,助力中国半导体实现从“跟跑”到“领跑”的跨越 [18]