文章核心观点 - Anthropic 因AI产品需求激增导致服务器算力紧张,正积极寻求在现有供应商(Google、Amazon、NVIDIA)之外,增加新的AI服务器芯片来源,以增强供应链议价能力并降低成本 [1] - 公司正与英国初创公司 Fractile 就采购其即将上市的推理芯片进行早期谈判,同时也在考虑自行设计芯片,并已与多家云服务商签订大规模长期协议,以确保未来算力供应 [1][4][7] Anthropic的算力需求与供应链策略 - 公司AI产品销售额激增,导致现有服务器不堪重负,服务器和芯片年支出预计将达到数百亿美元 [1] - 为应对算力紧张,公司近期与亚马逊和谷歌签订大规模云服务协议,以维持系统运行,营收增速自去年底以来已增长两倍 [4] - 公司于今年4月公布新协议,将从云服务商处获取价值数千亿美元的服务器资源,包括使用其定制芯片 [4] - 公司长期以来通过租用多种服务器芯片来开发和运行技术,以此与OpenAI等依赖NVIDIA硬件的公司进行区分 [1] 与Fractile的潜在合作 - Anthropic 正与成立仅三年的伦敦初创公司 Fractile 洽谈,计划在其推理芯片于明年上市时进行采购 [1] - Fractile 的推理芯片旨在高效运行完整AI模型,其技术依赖静态随机存取存储器,以减少数据在GPU与独立高带宽存储芯片间的传输需求 [2] - 此类交易若达成,将使 Anthropic 在面对主要供应商时获得更多议价能力 [1] - 与 Anthropic 的潜在协议成为 Fractile 最新融资轮次的重要卖点,该轮融资目标是以超过10亿美元估值筹集逾1亿美元,Founders Fund、8VC和Accel等风投已就参与投资展开洽谈 [2] 行业竞争与成本压力 - AI公司和云服务提供商一直在竭力寻找英伟达芯片的推理替代方案,以降低成本并提高利润率 [2] - 去年,Anthropic 和 OpenAI 运营AI产品的毛利润率均低于预期,主要原因是推理成本高于预期,此后两家公司都专注于寻求与非英伟达AI芯片供应商签署新协议以降低成本 [2] - 英伟达CEO黄仁勋表示,后悔没有更早投资Anthropic,否则或许能阻止其成为谷歌和亚马逊芯片的重要客户 [6] - 去年秋天,Anthropic 承诺投入300亿美元租用微软Azure云平台的英伟达服务器,作为交换,英伟达投资100亿美元、微软投资50亿美元入股该公司 [6] Anthropic的多元化硬件战略 - 公司近期同意购买大量由谷歌制造的芯片,这些芯片将在谷歌云数据中心之外使用,使其对硬件的工作方式拥有更多控制权 [1] - 据路透社报道,公司正考虑自行设计推理芯片,以减少对英伟达的依赖,OpenAI和Meta Platforms也在采取类似策略 [7] - 公司迅速行动以确保AI芯片供应,此前其AI编程和Agent产品需求激增导致计算资源紧张,上个月甚至因高峰时段算力不足而限制了部分Claude Code用户的使用能力,并出现了服务中断 [7] Fractile公司背景 - Fractile 于2022年底由Walter Goodwin和Yuhang Song共同创立,Walter Goodwin拥有牛津大学AI与机器人学博士学位,曾在亚马逊从事机器人研发工作,Yuhang Song已于2024年离开公司另创一家初创公司 [7] - 该公司是众多致力于制造比英伟达GPU更高效运行AI模型的服务器芯片的初创公司之一,其他使用类似SRAM技术的公司包括Cerebras和Groq [2] - 公司此前已从Kindred Capital、Nato Innovation Fund和Oxford Science Enterprises等投资者处筹集了1500万美元资金 [7]
速递|Anthropic拟采购Fractile推理芯片,加速GPU去英伟达化