Workflow
RaBitQ算法
icon
搜索文档
内存厂暴跌上百亿,结果只是一个乌龙?
芯世相· 2026-04-02 12:13
文章核心观点 - 谷歌研究院发布了一项名为TurboQuant的极端压缩算法,宣称能将大模型推理时的KV cache内存压缩到约3.5 bit(约6倍),且几乎不丢精度,这引发了AI圈轰动并导致存储大厂股价应声下跌[3][4][6] - 随后该论文被指控存在严重的学术不端行为,包括算法与苏黎世联邦理工学院团队早先的RaBitQ高度撞车、测试时存在不公平的硬件与软件对比、以及无视数学证明贬低对手工作,导致其宣传效果和市场影响受到根本性质疑[10][12][14][15][16] - 这场闹剧暴露了市场对AI技术高硬件成本(尤其是内存)的普遍焦虑与不耐,一个尚未商用且存在争议的算法就能引发巨大市场波动,反映了行业渴望降低AI部署成本的强烈愿望[23][25][28][34][35] 事件概述:TurboQuant的发布与市场影响 - 2026年3月24日,谷歌研究院发布TurboQuant算法,声称可将大模型推理所需内存从600G大幅减少至100G[4][6] - 消息发布后,主要存储厂商股价应声下跌:美光科技股价下跌3.4%,市值损失151.66亿美元;闪迪股价一度大跌6.5%,收盘跌3.5%,市值损失36.3亿美元;西部数据下跌1.63%,市值损失16.64亿美元[6] - 该消息在社交媒体获得数千万次浏览,被比作“谷歌的DeepSeek时刻”,引发了AI圈的广泛关注[8][19] 学术争议:对TurboQuant的指控 - 2026年3月27日,苏黎世联邦理工学院高健扬博士指控TurboQuant论文存在学术不端,其核心算法与团队更早的RaBitQ算法高度相似,底层均采用“随机旋转加JL变换”[10][12] - 证据显示,TurboQuant论文作者曾在2025年1月向高博士求助如何跑通RaBitQ代码,但在最终论文中未提及RaBitQ的工作,并贬低其理论为“理论次优、分析粗糙”[14][15] - 论文中的性能对比被指存在严重不公:用算力怪兽A100 GPU运行TurboQuant,却用关掉多线程的CPU运行对比算法;且未使用对手高度优化的C++开源代码,而使用自行翻译的半吊子Python版本[16] - 这篇带有错误的论文被ICLR 2026会议接收,并通过谷歌官方渠道推广,而相关的不公平测试条件在论文中被完全抹去[17][18][19] 市场反应与后续发展 - 学术指控公开后,市场情绪有所缓和。例如,在相关方回复指控的当天(2026年3月28日),美光科技股价收涨0.5%,成交额达162.46亿美元,但该周累计仍下跌15.5%[20][21] - 事件初期,市场和分析师更多关注算法可能带来的成本下降(符合“杰文斯悖论”),即成本降低可能刺激更大规模的应用,最终反而拉动算力和存储需求,但对算法本身有效性的质疑声被淹没[23][25] 行业背景:AI硬件成本焦虑 - AI发展推高了硬件需求,成本压力已传导至消费端。自2025年底起,多款主流手机因内存涨价而提价,涨幅在300元至500元人民币不等[28][29] - 然而,AI的实际行业渗透率和生产力提升效果仍不明确。研究显示,仅有少数职业在使用AI,且渗透率并不高,但其带来的硬件成本上涨已由全社会共同承担[30][31][34] - 正是这种对AI“硬件吞金兽”的普遍不耐,使得一个存在问题的算法消息能迅速引发巨大的市场波动,反映了行业对降低AI部署成本的迫切期待[28][35]