英伟达将推出新推理芯片

韩国股市波动与英伟达技术传闻 - 韩国KOSPI指数过去两日跌幅均超过10%,创2008年以来最大两日跌幅[1] - 市场普遍将下跌归因于地缘政治引发的全球资金避险情绪[1] - 有分析指出,一则关于英伟达的技术传闻对韩国内存股造成了精准打击[1] - 传闻称英伟达正在开发一种利用Groq片上SRAM架构的新型推理芯片,并计划在3月GTC大会上公布[1] - 此消息导致投资者担忧SRAM会减少对包括HBM在内的主内存需求,进而打击了韩国内存股[1] - 韩国股市随后出现强劲反弹,KOSPI指数当日涨幅扩大至11%,三星电子大涨13%,SK海力士飙升15%[1] 市场对SRAM芯片冲击的潜在误判 - 分析机构KIS指出,认为低成本SRAM推理芯片将减少HBM等主内存使用的观点,反映了对内存的糟糕理解[2] - 从物理特性看,SRAM单元面积更大,密度低于DRAM,导致其每比特成本显著更高[2] - 对于相同容量,SRAM通常需要DRAM 5到10倍的裸片面积[2] - SRAM历史上一直用于需要极低延迟的缓存或片上缓冲应用,而非作为存储大量数据的主内存[2] SRAM架构的定位与内存层级多元化趋势 - SRAM架构并非DRAM的替代品,而是一个独立的选项[5] - 与DRAM相比,以SRAM为中心的架构具有访问延迟极低和数据移动最小化的优势[5] - 英伟达计划利用Groq架构,是为了针对GPU难以处理的特定推理工作负载进行优化[5] - 采用SRAM架构应被理解为针对需要超低延迟的特定数据中心工作负载,以及需要实时响应的物理AI边缘应用的独特选择[5] - 例如,OpenAI已在其数据中心部署了Cerebras的SRAM芯片,并基于此提供收费更高的API服务[5] - 基于Groq的SRAM架构的普及将进一步细分AI基础设施内的内存层级[5] - HBM和DRAM将继续作为大规模模型训练和通用推理服务器的主内存[5] - 涵盖SRAM、HBM和DRAM的内存层级将变得越来越具有多层次性,最终推动整个内存行业总潜在市场的扩张[6]

英伟达将推出新推理芯片 - Reportify