黄仁勋:SRAM无法取代HBM

文章核心观点 - 英伟达执行长黄仁勋认为,尽管存在SRAM、GDDR和开放权重模型等替代方案以降低成本,但在实际大规模AI生产环境中,HBM因其在带宽、密度和应对动态工作负载方面的综合优势,仍是不可或缺的[1][2][3] 关于SRAM与HBM的技术路线讨论 - SRAM速度快且能避免外部内存延迟,对某些工作负载有效,但其容量限制是主要瓶颈,黄仁勋指出能放入SRAM的模型大小比实际需求小约100倍[1][2] - 在实际AI生产负载中,SRAM可能因容量限制难以兼顾带宽与密度,一旦模型溢出SRAM,效率优势就会崩溃,系统需依赖外部内存[1][2] - HBM能够应对AI工作负载的不断变化和规模需求,这是SRAM等替代方案在单一情境下有效,但在大规模生产环境中会与现实发生碰撞的关键原因[1] AI工作负载的多样性与硬件需求 - AI工作负载持续变化,包括混合专家模型、多模态模型、扩散模型等多种架构,每种对硬件造成的压力不同,如内存限制、互连带宽需求、延迟要求等[2] - 硬件压力会随时间动态转移,有时压力在NVLink上,有时在HBM内存上,有时三者同时承受压力[2] - 开放权重模型并不能消除对大容量内存池、高速互连或灵活执行引擎的需求,它仅仅改变了模型的拥有者[2] 对成本与需求的看法 - 尽管存在客户对HBM成本和GPU价格的抱怨,但公司认为两者之间不存在矛盾,因为AI模型尚未趋于稳定或分化成可预测的层级[3] - 黄仁勋指出,若只针对特定工作负载优化,可能导致数据中心10%甚至5%的资源未被充分利用,而这些资源本可用于其他任务[2]

黄仁勋:SRAM无法取代HBM - Reportify