Workflow
专用内存架构
icon
搜索文档
突破DRAM和SRAM瓶颈
半导体行业观察· 2025-08-29 08:44
内存技术规模化停滞 - SRAM和DRAM已停止规模化发展 无法降低单位成本(每GB) [2][4] - 内存现占服务器硬件成本50%以上 成为系统主要瓶颈 [4] - 7nm工艺节点后SRAM单元尺寸停止显著缩小 DRAM成本过去15年停滞不前 [10][13] 新兴内存技术优势与局限 - RRAM在相同工艺节点下密度可达最先进HBM4的10倍 且可继续向更小工艺尺寸规模化 [17][20] - 增益单元嵌入式DRAM密度达SRAM的2-3倍 允许片上集成 [16][17] - 新兴技术存在固有局限:RRAM耐久性有限且写入能耗高 增益单元RAM需定期刷新 [21] 专用内存架构提案 - 提出两类新型内存:短期内存(StRAM)针对瞬态数据优化 长期内存(LtRAM)针对持久性读密集型数据优化 [6][23] - StRAM适用于生命周期亚秒级数据 如神经网络激活缓冲区 服务器临时数据结构 [26] - LtRAM适用于生命周期分钟级以上数据 如机器学习模型权重 代码页 静态数据页 [26][27] 工作负载适配案例 - 大型语言模型推理中 模型权重适合LtRAM 激活值适合StRAM [28][31] - 服务器应用中Redis/Memcached等读密集型工作负载适合LtRAM 日志/事件缓冲系统适合StRAM [29] - 处理器内核内短期临时数据(函数调用栈/中间结果)适合StRAM替代SRAM [32][33] 系统集成挑战 - 需打破传统内存层次结构 实现非层次化数据放置策略 [36] - 一致性协议需适配StRAM有限保留时间和LtRAM不对称读写特性 [40] - 内存功耗占系统显著比例 专业化需协同优化单元特性/互连/封装/数据分配 [41][43] 行业影响与趋势 - HBM封装超过20层裸片后密度增长将停止 受限于封装复杂性和成本 [10][14] - AI机架功耗预计2027年达600kW 内存专业化成为降低功耗关键手段 [41] - 需跨学科合作解决材料科学、器件物理、电路设计、系统架构等多方面问题 [46]