PolarQuant - 财报，业绩电话会，研报，新闻

PolarQuant

搜索文档

TurboQuant“横空出世”，科技圈高呼“谷歌版DeepSeek”、“真实版Pied Piper”，华尔街“呵呵，抄底内存股”

华尔街见闻· 2026-03-26 08:59

文章核心观点 - 谷歌发布的新型AI内存压缩技术TurboQuant引发市场对存储硬件长期需求的担忧，导致美股存储芯片板块股价大幅下挫 [1][4] - 华尔街投行普遍认为市场反应过度，该技术的实际影响被夸大，并建议投资者应借股价回调之机买入存储芯片概念股 [3][13] - 从长期经济学视角看，该技术通过提升效率、降低成本，可能激活更多AI应用场景，从而提振而非摧毁对算力与内存硬件的总需求 [3][16] 市场反应 - 谷歌发布名为TurboQuant的内存压缩算法后，市场担忧蔓延，导致存储芯片板块资产遭抛售 [4] - 周三盘中，存储芯片与硬件供应链指数一度触及109点的日内低点，最终报收于113.03点，当日下跌2.08% [4] - 个股方面，闪迪盘中一度大跌6.5%，收盘跌超3.4%；美光科技跌4%，收盘跌超3.4%；西部数据跌超4%，收盘跌幅收窄至1.6%；希捷科技跌超5%，收盘跌2.6% [4] 技术细节 - TurboQuant是一种旨在解决AI系统中键值缓存（KV Cache）瓶颈的内存压缩技术 [5] - 其核心是将原本占用大量空间的缓存压缩至3比特 [5] - 技术采用两步压缩法：先通过PolarQuant技术将数据向量转换为极坐标以消除额外的归一化开销，再利用量化算法QJL消除残差误差 [6] - 在采用Gemma和Mistral等开源模型的测试中，该算法实现了至少6倍的内存占用缩减 [4][7] - 在英伟达H100 GPU上，其性能较未量化的32位方案提升了最高8倍 [7] 行业观点：市场过度反应与买入机会 - 华尔街分析师指出，该技术的实际影响被市场过度计价 [3] - Lynx Equity Strategies分析师质疑技术的“颠覆性”，指出当前推理模型已广泛采用4比特量化，8倍性能提升是与老旧的32位模型对比的结果 [14] - 该分析师认为，先进压缩技术仅是为了缓解算力瓶颈，不会破坏未来三到五年内因供应受限而依然坚挺的内存与闪存需求 [14] - 该分析师维持对美光科技700美元的目标价及买入评级，并建议在因谷歌消息引发的回调中买入 [14] - Wells Fargo分析师指出，历史经验表明压缩算法从未从根本上改变硬件采购的整体规模，目前AI内存的需求基本面依然强劲 [15] 长期影响：杰文斯悖论与需求提振 - 摩根士丹利分析指出，TurboQuant仅作用于推理阶段的键值缓存，不影响模型训练任务，也不影响模型权重所占用的高带宽内存（HBM） [16] - 该技术的核心意义在于提升单GPU的吞吐量，使相同硬件能支持更长的上下文或更大的批处理规模 [16] - 摩根士丹利援引“杰文斯悖论”阐释，技术效率提升会降低使用成本，从而激发出更庞大的总需求 [16] - 通过大幅降低单次查询的服务成本，该技术能让原本只能在云端昂贵集群上运行的模型迁移至本地，有效降低AI规模化部署的门槛 [16] - 效率提升将激活更多原本受制于成本而无法落地的AI应用场景，对算力与内存硬件的长期影响是“中性偏正面”的积极信号 [16]

谷歌AI内存技术工程化失败？TurboQuant“横空出世”，科技圈呼“谷歌版DeepSeek”、“真实版Pied Piper”！华尔街“呵呵，抄底内存股”！

美股IPO· 2026-03-26 08:44

文章核心观点 - 谷歌发布TurboQuant AI内存压缩技术，宣称将大模型缓存内存缩减6倍、性能提升8倍，引发市场对存储硬件长期需求的担忧，导致存储芯片板块股价重挫 [1][2][6] - 华尔街投行认为市场反应过度，该技术的实际影响被过度计价，并建议投资者应借机买入回调的内存概念股 [1][4][8] - 从长期宏观经济学视角看，技术效率提升（如杰文斯悖论所示）将降低AI部署成本、激活更庞大的应用规模，从而对算力与内存硬件的长期需求产生中性偏正面影响 [1][4][11] 存储板块市场反应 - 谷歌发布TurboQuant技术后，市场担忧存储硬件长期需求，相关资产遭抛售，存储芯片板块集体下挫 [6] - 周三盘中，闪迪一度大跌6.5%，美光科技跌4%，西部数据和希捷科技分别跌超4%和5% [6] - 截至收盘，存储芯片与硬件供应链指数下跌2.08%至113.03点，盘中一度触及109点的日内低点，闪迪和美光科技均跌超3.4% [2][6] TurboQuant技术细节与业界评价 - 该技术专为解决AI系统中的键值缓存（KV Cache）瓶颈，核心是将缓存压缩至3比特，采用PolarQuant和量化算法QJL的两步压缩法 [7] - 在采用Gemma和Mistral等开源模型的测试中，该算法实现了6倍的内存缩减，在英伟达H100 GPU上的性能较未量化的32位方案提升了最高8倍 [7] - 科技业界将其戏称为“真实版Pied Piper”或谷歌的“DeepSeek时刻”，认为其有望通过极高效率大幅拉低AI运行成本 [4][7] 华尔街机构观点与分析 - 分析师质疑技术的“颠覆性”，指出当前推理模型已广泛采用4比特量化，8倍性能提升是与老旧的32位模型对比的结果 [9] - 分析师认为先进压缩技术仅是为了缓解算力瓶颈，不会破坏未来三到五年内因供应受限而依然坚挺的内存与闪存需求 [9] - 有机构维持对美光科技700美元的目标价及买入评级，并明确建议在因谷歌消息引发的回调中买入 [9] - 历史经验表明，压缩算法从未从根本上改变硬件采购的整体规模，目前AI内存的需求基本面依然强劲 [9] 长期需求影响：杰文斯悖论视角 - 摩根士丹利指出，TurboQuant仅作用于推理阶段的键值缓存，不影响模型训练任务，也不影响模型权重所占用的高带宽内存（HBM） [10] - 该技术的核心意义在于提升单GPU的吞吐量，使相同硬件能支持更长的上下文或更大的批处理规模 [10] - 援引“杰文斯悖论”，技术效率提升会降低使用成本，从而激发出更庞大的总需求，通过降低单次查询成本，能让原本昂贵的云端模型迁移至本地，降低AI规模化部署门槛 [11] - 效率提升将激活更多受制于成本而无法落地的AI应用场景，对算力与内存硬件的长期影响呈“中性偏正面”信号 [1][11]