RaBitQ算法 - 财报，业绩电话会，研报，新闻

RaBitQ算法

搜索文档

芯世相· 2026-04-02 12:13

文章核心观点 - 谷歌研究院发布了一项名为TurboQuant的极端压缩算法，宣称能将大模型推理时的KV cache内存压缩到约3.5 bit（约6倍），且几乎不丢精度，这引发了AI圈轰动并导致存储大厂股价应声下跌[3][4][6] - 随后该论文被指控存在严重的学术不端行为，包括算法与苏黎世联邦理工学院团队早先的RaBitQ高度撞车、测试时存在不公平的硬件与软件对比、以及无视数学证明贬低对手工作，导致其宣传效果和市场影响受到根本性质疑[10][12][14][15][16] - 这场闹剧暴露了市场对AI技术高硬件成本（尤其是内存）的普遍焦虑与不耐，一个尚未商用且存在争议的算法就能引发巨大市场波动，反映了行业渴望降低AI部署成本的强烈愿望[23][25][28][34][35] 事件概述：TurboQuant的发布与市场影响 - 2026年3月24日，谷歌研究院发布TurboQuant算法，声称可将大模型推理所需内存从600G大幅减少至100G[4][6] - 消息发布后，主要存储厂商股价应声下跌：美光科技股价下跌3.4%，市值损失151.66亿美元；闪迪股价一度大跌6.5%，收盘跌3.5%，市值损失36.3亿美元；西部数据下跌1.63%，市值损失16.64亿美元[6] - 该消息在社交媒体获得数千万次浏览，被比作“谷歌的DeepSeek时刻”，引发了AI圈的广泛关注[8][19] 学术争议：对TurboQuant的指控 - 2026年3月27日，苏黎世联邦理工学院高健扬博士指控TurboQuant论文存在学术不端，其核心算法与团队更早的RaBitQ算法高度相似，底层均采用“随机旋转加JL变换”[10][12] - 证据显示，TurboQuant论文作者曾在2025年1月向高博士求助如何跑通RaBitQ代码，但在最终论文中未提及RaBitQ的工作，并贬低其理论为“理论次优、分析粗糙”[14][15] - 论文中的性能对比被指存在严重不公：用算力怪兽A100 GPU运行TurboQuant，却用关掉多线程的CPU运行对比算法；且未使用对手高度优化的C++开源代码，而使用自行翻译的半吊子Python版本[16] - 这篇带有错误的论文被ICLR 2026会议接收，并通过谷歌官方渠道推广，而相关的不公平测试条件在论文中被完全抹去[17][18][19] 市场反应与后续发展 - 学术指控公开后，市场情绪有所缓和。例如，在相关方回复指控的当天（2026年3月28日），美光科技股价收涨0.5%，成交额达162.46亿美元，但该周累计仍下跌15.5%[20][21] - 事件初期，市场和分析师更多关注算法可能带来的成本下降（符合“杰文斯悖论”），即成本降低可能刺激更大规模的应用，最终反而拉动算力和存储需求，但对算法本身有效性的质疑声被淹没[23][25] 行业背景：AI硬件成本焦虑 - AI发展推高了硬件需求，成本压力已传导至消费端。自2025年底起，多款主流手机因内存涨价而提价，涨幅在300元至500元人民币不等[28][29] - 然而，AI的实际行业渗透率和生产力提升效果仍不明确。研究显示，仅有少数职业在使用AI，且渗透率并不高，但其带来的硬件成本上涨已由全社会共同承担[30][31][34] - 正是这种对AI“硬件吞金兽”的普遍不耐，使得一个存在问题的算法消息能迅速引发巨大的市场波动，反映了行业对降低AI部署成本的迫切期待[28][35]

Micron Technology(US:MU)