内存附近处理(PNM)
搜索文档
HBM,新战场
半导体芯闻· 2026-01-14 17:42
核心观点 - SK海力士发布名为“StreamDQ”的定制化HBM技术 旨在通过将部分原由GPU处理的任务转移至HBM 以解决AI推理过程中的性能瓶颈 从而显著提升数据处理效率 并被视为应对定制化HBM时代的关键利器 [1][2] 技术细节与实现 - StreamDQ技术的核心理念是将现有GPU中的部分控制器功能(特别是反量化任务)转移至HBM的基础芯片上 [1][2] - 该技术通过在HBM数据流经时实时进行反量化 使GPU能立即开始计算 无需等待 其名称即来源于数据流中实时反量化的方法 [3] - 公司在基础芯片上添加GPU控制器等逻辑功能时 利用了台积电的先进工艺 未面临重大挑战 [2] - 公司还通过在基础芯片上应用UCIe接口提高了芯片集成度 UCIe是一种将芯片分割成功能单元后再连接制造的尖端技术 [2] 性能提升与优势 - 传统上由GPU处理的反量化任务 会消耗高达大规模语言模型整体推理时间的80% [3] - 采用StreamDQ技术后 之前受内存瓶颈困扰的LLM推理处理速度预计将提升约7倍 整个AI加速器的推理速度也将显著提升 [3] - 将处理数据的系统半导体放置在内存附近并只接收结果 从系统角度看效率非常高 这体现了内存附近处理的概念 [3] - 从GPU厂商角度看 将部分功能迁移至HBM能为芯片设计提供更大灵活性 释放更多的芯片内部空间 从而可能提高系统半导体的性能和效率 [1][2] 产品发布与商业化 - 公司在美国拉斯维加斯“CES 2026”展会的私人展厅中发布了其定制HBM技术 [1] - 公司正向包括NVIDIA在内的主要客户推介StreamDQ技术 以实现定制化HBM的商业化 预计将积极向全球科技巨头推广 [1][2] - 定制HBM预计将从下一代版本HBM4E(第七代HBM)开始得到全面应用 [1] - 定制HBM与现有标准HBM的关键区别在于 在基础芯片上添加了客户特定的功能 [1] - 随着从HBM4开始加入各种逻辑功能 HBM基础芯片的大规模生产主要依靠代工厂代工 [1]