TurboQuant
搜索文档
Credo: Alphabet Just Announced A Game Changer
Seeking Alpha· 2026-03-26 23:57
Alphabet (Google) 发布新算法以解决AI计算内存瓶颈 - 公司于3月25日宣布推出三套新算法,旨在解决日益加剧的AI计算内存瓶颈问题 [1] - 其中处于前沿的是名为“TurboQuant”的算法,其设计目标是压缩日益增大的关键(数据)[1]
事关停火!刚刚,特朗普最新发声!伊朗,大消息!
券商中国· 2026-03-26 23:20
地缘政治与市场反应 - 美股三大指数在3月26日晚间低开后拉升,随后大幅回落,截至发稿,道指跌0.29%,纳指跌1.14%,标普500指数跌0.76% [3][4] - 伊朗已通过中间人(巴基斯坦)正式回应美国提出的15点停火方案,回应中要求停止侵略、确保战争不再重演、赔偿损失并推动所有战线结束行动,同时强调对霍尔木兹海峡的主权 [3][4][6] - 伊朗军方知情人士称,伊朗已组织超过一百万人为地面战斗做准备 [3] - 美国总统特朗普声称伊朗因战败而对话,并表示在达成协议前将继续施压,他认为油价与股市波动并不“严重” [3] - 以色列总理内塔尼亚胡证实,以方正“全力”打击伊朗目标,并称已对伊朗伊斯兰革命卫队海军司令实施定点打击 [6] 科技股与存储芯片板块动态 - 美股大型科技股多数下跌,Meta跌超3%,英伟达、谷歌、博通跌超1%,苹果和微软逆势上涨 [4] - 美股存储芯片板块全线大跌,闪迪大跌超6%,美光科技、西部数据大跌超4%,希捷科技大跌超3% [7][8] - 存储芯片板块下跌与谷歌推出TurboQuant算法有关,该算法可将大型语言模型运行时的缓存内存占用减少至少6倍,性能提升8倍,市场担忧这会减少AI推理对内存的需求 [8] - 有分析认为TurboQuant的“颠覆性”被夸大,其8倍性能提升是与老旧的32-bit模型对比,而当前推理模型已广泛采用4-bit量化 [8] - 摩根士丹利分析指出,该技术仅作用于推理阶段的键值缓存,不影响模型权重占用的HBM,也不影响训练,且可能通过降低服务成本提振整体AI需求 [8][9] 各方对谈判的立场与行动 - 伊朗方面认为美国的谈判表态是“第三次欺骗”计划的一部分,旨在蒙蔽世界、维持低油价并为地面入侵争取时间,伊朗在“12日战争”后已对美国谈判诚意丧失信心 [5] - 巴基斯坦外交部长证实美伊间接谈判正通过巴方传递信息,土耳其、埃及等国也表示支持,巴方强调对话是唯一出路 [6] - 路透社报道称,伊朗高级官员表示外交谈判并未停止,若华盛顿秉持务实态度,仍有可能找到推进路径 [5]
Micron's Future Hinges on 2 Emerging Challenges
247Wallst· 2026-03-26 23:05
美光科技强劲的财务表现 - 2026财年第一季度营收达136.4亿美元,超出市场预期5.91% [2][4] - 第一季度盈利同比飙升771% [2][4] - GAAP毛利率从去年同期的38.4%大幅扩张至56.0% [2][4] - 公司对2026财年第二季度给出强劲指引,预计营收为187亿美元,非GAAP每股收益为8.42美元 [9] - 公司启动了54亿美元的债务回购要约,显示其资产负债表稳健 [9] - 在覆盖公司的分析师中,有38位给予“买入”或“强力买入”评级,仅3位“持有”和2位“卖出”,共识目标价为524.73美元 [9] - 公司远期市盈率仅为7.6倍,相对于其增长速度处于较低水平 [9] 面临的两大结构性挑战 - **挑战一:谷歌TurboQuant算法** [5] - 谷歌推出的TurboQuant是一套先进的量化算法,可将大型语言模型的关键值内存大小压缩至少6倍,且不损失精度 [3][5] - 该技术若广泛应用,可能削弱对高带宽内存和DRAM的长期需求增长轨迹,而美光的增长故事高度依赖于AI基础设施对高带宽内存的持续消耗 [5] - 这引发了市场对内存组件高价格长期可持续性的担忧 [5] - 尽管美光订单可见度已至2027年,提供了短期保障,但长期需求天花板可能因AI效率提升而比当前预期更早到来 [6] - **挑战二:SK海力士在美上市** [7] - SK海力士计划在美国交易所上市,为美国投资者提供了除美光外的另一个内存芯片投资选择 [7] - SK海力士目前是高带宽内存市场的主导供应商,并已从ASML获得了80亿美元的极紫外光刻机订单,显示出积极的产能投资信号 [2][7] - 在美上市将引导原本难以直接投资SK海力士的美国零售和机构资金流向这个直接竞争对手 [7] - 美光作为“唯一美国本土内存制造商”的叙事和政策回流优势,可能因SK海力士在美上市而减弱 [8] 行业与市场背景 - 美光股价在近期交易中一度下跌多达5%,市场对第二季度财报和AI内存压缩技术感到担忧 [14] - 高带宽内存对于人工智能产业至关重要,是关键的AI增长市场 [17][18] - 内存芯片行业正面临全行业性的短缺,这提振了投资者对相关公司的乐观情绪 [15]
Micron’s Future Hinges on 2 Emerging Challenges
Yahoo Finance· 2026-03-26 23:05
美光科技2026财年第一季度业绩表现 - 公司2026财年第一季度营收达到136.4亿美元,超出市场预期5.91% [2][7] - 当季收益同比飙升771% [2][7] - GAAP毛利率从去年同期的38.4%大幅扩张至56.0% [2][7] 行业面临的结构性挑战 - 谷歌发布TurboQuant算法,可将大型语言模型的关键值内存大小压缩至少6倍而不损失精度,这可能削弱对HBM和DRAM的长期需求轨迹 [3][7] - 公司整个增长故事依赖于AI基础设施构建消耗越来越多的高带宽内存,而AI效率的提升可能像摩尔定律影响计算效率一样,使内存需求的天花板比当前订单簿显示的更早到来 [3][4] - 尽管公司的订单簿已排至2027年,提供了短期保障,但长期需求可持续性存疑 [4] 市场竞争格局变化 - SK海力士计划在美国交易所上市,为美国投资者提供了除美光之外的内存芯片市场新选择 [6][7] - SK海力士目前是HBM市场的主导供应商,并已从阿斯麦获得了价值80亿美元的EUV光刻机订单,表明其正在进行积极的产能投资 [6][7] - SK海力士在美上市将引导原本难以直接投资该公司的零售和机构资金流向一个直接的HBM竞争对手 [6]
TurboQuant“横空出世”,科技圈高呼“谷歌版DeepSeek”、“真实版Pied Piper”,华尔街“呵呵,抄底内存股”
硬AI· 2026-03-26 22:33
01 存储板块应声下挫 谷歌AI内存压缩技术TurboQuant横空出世,宣称将大模型缓存内存缩减6倍、性能提升8倍,瞬间引爆市场恐慌——美光科技、闪迪等存储巨头盘中重挫逾5%。然而华尔街投行却 高呼"抄底":有分析认为,历史经验表明压缩算法的存在从未从根本上改变硬件采购的整体规模,摩根士丹利援引杰文斯悖论指出,效率革命非但不会压缩硬件需求,反将激活更庞 大的AI部署规模。 硬·AI 作者 | 叶 桢 编辑 | 硬 AI 谷歌发布的一项新型AI内存压缩技术,不仅在科技界引发了对底层算力效率革命的狂欢,也让美股存储芯片板块经历了一场剧烈的估值重估,但华尔街机构却从这 场恐慌中看到了买入良机。 周三,受该技术可能大幅削减AI硬件需求预期的冲击,美股存储芯片板块盘中遭遇重挫。 截至收盘,存储芯片与硬件供应链指数下跌2.08%,闪迪、美光科技等头 部企业均显著收跌,凸显出市场对需求前景的防御性反应。 然而,在科技圈将这一突破性技术捧为"真实版Pied Piper"和"谷歌版DeepSeek"的同时,华尔街投行的表态却截然不同。 多位分析师指出,该技术的实际影响被市 场过度计价,并直言投资者应借机买入回调的内存概念股。 ...
Likely Short-Term ETF Winners & Losers Amid Google Breakthrough
ZACKS· 2026-03-26 21:02
谷歌TurboQuant技术引发市场反应 - 谷歌推出名为“TurboQuant”的新技术 声称可将大语言模型的内存使用量至少降低六倍 从而可能削减人工智能的整体训练成本[1] - 该消息引发市场对内存需求减弱的担忧 导致内存制造商股票遭到抛售[1] 分析师对内存市场影响的评估 - 摩根大通分析师指出 该消息可能引发短期获利了结 但不会对近期内存需求构成威胁[2] - 市场分析认为这是短期获利了结的机会 而非对芯片需求的结构性打击 内存制造商的中期基本面依然强劲[6][7] 短期潜在受益的ETF - Roundhill生成式AI与技术ETF(CHAT) 在2026年3月25日上涨2.1% 盘后进一步上涨约1% 因该技术有望提升AI投资回报 缓解市场对AI投资回报的疑虑[3] - Roundhill美股七巨头ETF(MAGS) 昨日上涨0.6% 摩根士丹利分析师认为该技术通过提升成本效益和性能 增强了超大规模云服务商的回报 可能加速AI工作负载的采用[4] 短期可能承压的ETF - Direxion每日MU看涨2倍ETF(MUU) 当日暴跌约7% 盘后再跌约4% 因其主要成分股美光科技股价在消息后下跌3.4% 盘后续跌1.9% 美光作为高性能内存和存储技术制造商 易受此消息影响[5] - iShares MSCI韩国ETF(EWY) 承压 因其重要成分股SK海力士在3月26日股价下跌约6.2% SK海力士是AI应用内存芯片的关键制造商[6]
反复挨打
Datayes· 2026-03-26 20:12
市场整体表现 - 3月26日,A股三大指数集体下跌,上证指数跌1.09%,深成指跌1.41%,创业板指跌1.34%,北证50指数跌1.57% [14] - 市场成交额较上日缩量2359.19亿元,至19571.32亿元,两市超4400只个股下跌 [14] - 沪指再度跌破3900点大关,市场热点全面熄火调整 [14] - 万得全A在6400-6470点附近存在跳空缺口,该区域筹码沉淀较少,反弹过程中面临的兑现压力有限 [6] 地缘政治与宏观环境 - 中东紧张局势持续升级,伊朗宣布对以色列方向发起导弹打击,国际油价再度上行 [5][15] - 布伦特原油日内涨超4%,报101.40美元/桶;WTI原油涨超4%,报94.11美元/桶 [19] - 知情人士称,国际货币基金组织(IMF)正就伊朗战争持续情景进行推演,评估各国潜在融资需求 [4] - 特朗普政府也在模拟油价飙升至每桶200美元对经济的冲击 [4] - 有报道称,特朗普认为冲突正进入最后阶段,并敦促顾问们遵守其此前公开提出的四到六周时间表 [4] - 美国驻华大使馆发文称,特朗普将于5月14日至15日来华,市场预期冲突可能还将持续一个月 [5] 行业与板块动态 锂电池与新能源汽车 - 锂电池板块逆势走强,融捷股份斩获3连板,丽岛新材、衢州东峰、大东南等个股涨停 [14] - 3月新能源汽车市场在“以旧换新”细则落地及小米SU7等春季新车潮带动下,需求释放远超预期 [14] - 3月锂电产业链排产环比大幅回升,部分环节再现“抢货”盛况 [14] - 碳酸锂期货价格今年一季度累计涨幅已接近20%,原材料价格企稳回升迹象明显 [14] 电力板块 - 部分资金回流电力板块,华电能源、新能泰山、湖南发展、中闽能源等人气股再度涨停 [14] - 截至2月底,全国累计发电装机容量已达39.5亿千瓦,同比增长15.9% [14] 石油化工与油气 - 化工板块表现活跃,渤海化学、元利科技双双涨停 [15] - 全球化工巨头巴斯夫发布第五轮涨价函,宣布对旗下基础胺类产品提价,最高涨幅达30% [15] - 受中东局势影响,A股油气板块午后拉升,蓝焰控股涨停,首华燃气涨超6% [15] 商业航天 - 受SpaceX拟向监管机构提交IPO说明书利好催化,航天板块开盘活跃,但随后冲高回落,收跌1.21% [15] - 再升科技、神剑股份、西部材料三只个股涨停 [15] 存储与半导体 - 谷歌发布TurboQuant压缩算法,能将AI模型的键值(KV)缓存内存占用降低6倍,并在相同数量GPU下使速度提升8倍,且保持零精度损失 [11] - 市场担忧该软件技术突破将威胁存储厂商议价权,隔夜美股存储股普跌,A股存储板块低开低走,佰维存储、兆易创新、普冉股份跌超5% [15] - 有观点认为,若谷歌能用六分之一的硬件实现相同推理结果,对存储芯片的需求将成反比崩塌 [12] - 中国科学院公布RISC-V领域系列重要成果,集中发布“香山”开源处理器与“如意”原生操作系统,并启动下一代芯片与操作系统的联合研发 [16] - 沐曦股份2025年营业收入16.44亿元,同比增长121.26%,净亏损7.89亿元,较上年同期14.09亿元亏损收窄 [16] 其他行业与公司 - 维生素C市场价格上涨,黑龙江新和成自3月25日起维生素C产品对外报价上调至22-24元/公斤 [20] - 中芯国际2025年实现销售收入93.27亿美元,同比增长16.2%,产能利用率增至93.5%,毛利率增至21% [20] - 长鑫存储2025年营收大增约130%至550亿元,经调整净利润约30亿元,计划上半年冲刺科创板上市 [20] - 中国平安2025年归属于母公司股东的营运利润1344.15亿元,同比增长10.3% [20] - 山东黄金2025年实现营业收入1042.87亿元,同比增长26.38%;归母净利润47.39亿元,同比增长60.57% [20] - 中信证券2025年实现营业收入748.54亿元,同比增长28.79%;归属于母公司股东的净利润为300.76亿元,同比增长38.58% [20] - 泡泡玛特于3月26日回购了价值5.997亿港元的股票 [20] - 月之暗面被曝正处于考虑在香港进行首次公开招股(IPO)的早期阶段,已与中金公司和高盛集团进行过磋商 [17] 市场结构与资金流向 - 主力资金净流出777.72亿元,电子行业净流出规模最大 [28] - 北向资金今日总成交2495.51亿元 [28] - 行业表现分化,煤炭、石油石化、银行领涨,计算机、非银金融、通信领跌 [30] - 公用事业、环保、建筑装饰等板块交易热度提升居前 [30] - 非银金融、农林牧渔、食品饮料等板块市盈率(PE)目前处于历史百分位低位 [30] 机构观点与市场展望 - 华西证券指出,市场反弹仍主要由AI算力、有色、电力等前期领涨板块驱动,这些板块已积累较大涨幅,再度成为持续领涨主线的概率偏低 [8] - 若后续反弹继续依赖前期主线,行情的空间和持续性可能将面临考验 [8] - 国投证券指出,截至去年第四季度,泛科技机构仓位已超过50%,加出海超过7成,再加资源品接近9成,科技+出海+资源处于高仓位状态 [9] - 在高油价下美元由弱转强,流动性环境出现收缩的背景下,一轮声势浩大的“再均衡配置”(或高切低)难以避免 [9]
内存股集体大跌,原因竟是谷歌这篇一年前的论文
机器之心· 2026-03-26 19:41
事件概述 - 谷歌发布一篇关于TurboQuant技术的博客,引发美国内存股集体暴跌,其中闪迪一度跌6.5%,希捷科技跌超5%,西部数据跌超4%,美光科技跌4% [1][3][8] TurboQuant技术原理 - TurboQuant是一种压缩算法,可将大语言模型(LLM)的KV缓存内存占用减少至少6倍,速度提升高达8倍,且精度零损失 [6] - 技术核心是解决KV缓存问题:LLM生成文本时需保存历史信息的键(Key)和值(Value),随着提示词变长或模型层数增加,KV缓存体积线性膨胀,迫使硬件厂商使用昂贵的高带宽内存(HBM) [11] - 传统向量量化技术需为每个数据块存储全精度量化常数,导致每个数字多出1到2个bit的额外内存开销 [15] - TurboQuant采用两阶段压缩架构:第一阶段通过“随机旋转”和PolarQuant机制,将高维向量转换为极坐标表示,将数据拆分为“半径”和“角度”,使坐标分布集中,省去数据归一化步骤,将累赘内存开销削减为零 [16][17][18][20] - 第二阶段使用Quantized Johnson-Lindenstrauss变换(QJL),利用仅有的1 bit压缩空间处理微小残差,将向量数字简化为+1或-1的符号位,构建出无偏的内积量化器,彻底抹平计算偏差 [21][22][23][24] 技术性能表现 - 在超长上下文“大海捞针”任务中,TurboQuant将KV缓存压缩超过5倍的情况下,维持了完美的召回率;在普通生成任务中,使用3.5 bit极致压缩比也能做到质量无损 [26] - 基于Llama-3.1-8B-Instruct模型,在LongBench基准测试中,TurboQuant展现出强大的KV缓存压缩性能 [28] - 在H100 GPU上,使用4 bit版本的TurboQuant计算注意力逻辑的速度,比传统的32 bit无量化版本快8倍 [29] - 在向量数据库和搜索引擎的最近邻搜索领域,TurboQuant在召回率上击败现有乘积量化技术,并将庞大的索引构建时间压缩到几乎为零,例如在d=200维度上量化时间仅为0.0007秒,远低于其他方法 [32] - 在GloVe数据集(d=200)上,TurboQuant相对于多种最先进的量化基线,实现了最优的1@k召回率 [35] 对硬件市场的影响 - 该技术可能显著降低AI公司在推理端的硬件成本,原本需要8张高端显卡运行的大模型,现在可能只需两三张卡就能流畅运行 [36] - 这种底层算法突破有望打乱市场对内存芯片爆发式增长的预期,此前金融市场对内存芯片需求预期极度乐观 [13][36][37] - 尽管有此技术突破,内存、GPU、CPU等硬件价格似乎仍在继续上涨 [38]
A Google AI breakthrough is pressuring memory chip stocks from Samsung to Micron
CNBC· 2026-03-26 18:58
文章核心观点 - 谷歌发布名为TurboQuant的新型压缩方法 声称可将运行大型语言模型所需的内存减少六倍 该技术旨在提高AI模型效率 但引发市场对AI内存芯片需求可能放缓的担忧 导致全球主要内存芯片制造商股价下跌[1][3][4] 行业市场反应 - 全球两大内存芯片制造商SK海力士和三星股价在韩国市场分别下跌6%和近5%[2] - 日本闪存公司铠侠股价下跌近6%[2] - 美国公司闪迪和美光股价在周三下跌 并于周四美国盘前交易中继续走低[2] 技术突破细节 - 谷歌发布的技术名为TurboQuant 是一种新的压缩方法[3] - 该技术专注于减少键值缓存的大小 该缓存用于存储AI模型的过往计算结果以避免重复运算[3] - 技术目标是提高AI模型的运行效率[3] 投资者担忧与行业影响 - 投资者担忧该技术可能降低对AI内存芯片的需求 这类芯片一直是训练大型语言模型的关键组件[4] - Cloudflare首席执行官Matthew Prince将此项研究比作“谷歌的DeepSeek” 指出去年中国AI公司深度求索的效率突破曾导致科技股大幅抛售[4] - 该CEO指出 在优化AI推理的速度、内存使用、功耗和多租户利用率方面仍有巨大空间[5]
AI日报丨微软重组人力资源部门;谷歌公布应对AI记忆挑战的算法
美股研究社· 2026-03-26 18:36
AI行业动态与投融资 - OpenAI以6.5亿美元估值注资AI初创公司Isara,该公司致力于开发能让AI“智能体”相互沟通以解决金融、生物技术等行业复杂问题的软件[5] - 讯兔科技(Alpha派)在2026年3月完成近2亿元人民币A轮融资,距离其去年10月完成的超亿元Pre-A轮融资仅隔5个月[7] 公司业务与业绩 - 快手科技旗下可灵AI的年化收入运行率(ARR)在2026年1月已超过3亿美元,公司对可灵AI在2026年实现收入同比翻倍以上增长保持较强信心[6] - 微软宣布重组其人力资源部门,旨在转型人事职能以匹配业务优先事项,实现更紧密的跨团队协作、加快行动速度并简化运营[9] 技术合作与进展 - 网络安全公司SentinelOne与谷歌云建立多年期合作关系,共同开发和部署基于人工智能的网络安全解决方案,整合双方的技术与基础设施[10] - 谷歌公布了一组新算法(包括TurboQuant、量化约翰逊-林登斯特劳斯和极地量化),旨在减少运行大型语言模型和矢量搜索引擎所需的内存[11]