文章核心观点 - 谷歌发布TurboQuant AI内存压缩技术,宣称将大模型缓存内存缩减6倍、性能提升8倍,引发市场对存储硬件长期需求的担忧,导致存储芯片板块股价重挫 [1][2][6] - 华尔街投行认为市场反应过度,该技术的实际影响被过度计价,并建议投资者应借机买入回调的内存概念股 [1][4][8] - 从长期宏观经济学视角看,技术效率提升(如杰文斯悖论所示)将降低AI部署成本、激活更庞大的应用规模,从而对算力与内存硬件的长期需求产生中性偏正面影响 [1][4][11] 存储板块市场反应 - 谷歌发布TurboQuant技术后,市场担忧存储硬件长期需求,相关资产遭抛售,存储芯片板块集体下挫 [6] - 周三盘中,闪迪一度大跌6.5%,美光科技跌4%,西部数据和希捷科技分别跌超4%和5% [6] - 截至收盘,存储芯片与硬件供应链指数下跌2.08%至113.03点,盘中一度触及109点的日内低点,闪迪和美光科技均跌超3.4% [2][6] TurboQuant技术细节与业界评价 - 该技术专为解决AI系统中的键值缓存(KV Cache)瓶颈,核心是将缓存压缩至3比特,采用PolarQuant和量化算法QJL的两步压缩法 [7] - 在采用Gemma和Mistral等开源模型的测试中,该算法实现了6倍的内存缩减,在英伟达H100 GPU上的性能较未量化的32位方案提升了最高8倍 [7] - 科技业界将其戏称为“真实版Pied Piper”或谷歌的“DeepSeek时刻”,认为其有望通过极高效率大幅拉低AI运行成本 [4][7] 华尔街机构观点与分析 - 分析师质疑技术的“颠覆性”,指出当前推理模型已广泛采用4比特量化,8倍性能提升是与老旧的32位模型对比的结果 [9] - 分析师认为先进压缩技术仅是为了缓解算力瓶颈,不会破坏未来三到五年内因供应受限而依然坚挺的内存与闪存需求 [9] - 有机构维持对美光科技700美元的目标价及买入评级,并明确建议在因谷歌消息引发的回调中买入 [9] - 历史经验表明,压缩算法从未从根本上改变硬件采购的整体规模,目前AI内存的需求基本面依然强劲 [9] 长期需求影响:杰文斯悖论视角 - 摩根士丹利指出,TurboQuant仅作用于推理阶段的键值缓存,不影响模型训练任务,也不影响模型权重所占用的高带宽内存(HBM) [10] - 该技术的核心意义在于提升单GPU的吞吐量,使相同硬件能支持更长的上下文或更大的批处理规模 [10] - 援引“杰文斯悖论”,技术效率提升会降低使用成本,从而激发出更庞大的总需求,通过降低单次查询成本,能让原本昂贵的云端模型迁移至本地,降低AI规模化部署门槛 [11] - 效率提升将激活更多受制于成本而无法落地的AI应用场景,对算力与内存硬件的长期影响呈“中性偏正面”信号 [1][11]
谷歌AI内存技术工程化失败?TurboQuant“横空出世”,科技圈呼“谷歌版DeepSeek”、“真实版Pied Piper”!华尔街“呵呵,抄底内存股”!