行业与公司 * 涉及的行业为AI算力与云计算行业,核心公司为谷歌及其云平台GCP,同时涉及Meta、Anthropic、OpenAI、苹果、字节跳动、MiniMax等主要AI模型与科技公司[1][2][10][11] * 涉及的硬件包括谷歌的TPU系列(v7, v8, B200, B300, VR系列)、英伟达的GPU系列(H100, RTX系列)以及谷歌的视频生成模型VLOGGER[1][3][6][14][17][22] AI算力供需与价格 * 供需极度失衡:AI算力整体需求约为供给能力的十倍,紧张态势预计持续至2026年下半年,短期内无显著改善[1][4] * 租赁价格飙升: * B200芯片三年期预留价格从2025年底的3.0-3.3美元/小时上涨至2026年的6美元/小时,实现翻倍[1][3] * B200一年期预留价格超过7美元/小时[5] * H100芯片三年期预留价格从2025年底的1.8-1.9美元/小时低点,上涨至当前约3.5美元/小时或更高,同样翻倍[3][4][16] * 老客户H100续约价格普遍上涨30%以上,新客户基本按列表价销售,折扣极少[4] * 供应紧张原因:瓶颈从电力转向CPU、内存及封装等供应链环节,例如谷歌内部超过5万核(约一百多台服务器)的CPU需求需副总裁级审批[1][7] * 未来价格预期:计划于2027年交付的VR系列芯片价格预计将上调,TPU v8价格预计比早期预期上涨20%-30%[6][14] 主要云厂商(谷歌)动态与策略 * 内部资源矛盾:谷歌存在自有业务(如DeepMind模型训练、搜索、YouTube)与对外租赁服务之间的显著资源冲突,影响了Gemini模型的迭代速度[2][10] * TPU供给与分配: * 2026年谷歌整体TPU供给量预计为400-450万颗,其中仅约100-150万颗对外提供,GPU供给为几十万颗规模[2] * 对外供给中,Anthropic和Meta是核心客户,Anthropic在2026年向谷歌下达了约100万颗芯片订单[2] * 2027年TPU出货量预期上调至1200万颗,但谷歌自有数据中心无法完全承载,部分将通过NewCloud模式交付[9] * 模型定价策略:云厂商通过推出参数更小的“Light”或“Flash”模型实现名义降价,实则通过版本迭代维持并提升模型业务利润率[1][13][14][23] * 资本支出与战略:云厂商共识是未来一两年将继续增加资本支出以换取算力,支持模型研发并扩大云业务利润,例如谷歌近期筹集800亿美元资金主要投向未来Capex[25] 主要客户动态 * Meta: * 是谷歌Gemini模型的全球前三API调用客户,AI算力使用量排名低于Anthropic和苹果,但预计2027-2028年将成为GCP前三算力客户[3] * 调用量增长斜率很高,导致Gemini推理资源不堪重负,其服务被中断事件反映了算力资源的普遍紧张[2][10] * Anthropic: * 在2025年底提前激进购买了大量算力资源,使其在2026年算力短缺中占据优势,是一次成功的豪赌[2][11] * 在编程等垂直领域模型表现领先于谷歌Gemini,市场认可度高[11][12] * 客户结构:TPU头部客户集中度极高,主要大客户数量在十个以内,且锁定了绝大部分产能,2026年已无TPU v7芯片余量可供销售[15] 模型竞争格局与发展路径 * 发展路径分化:一派(如谷歌)致力于打造通用多模态大模型;另一派(如Anthropic、字节、MiniMax)专注于编程、视频生成等垂直赛道[11] * 市场反馈:专注于垂直赛道的路径市场认可度更高,通用模型面临客户粘性低、付费意愿不强、易陷入价格战的问题[11] * 具体领域表现:在代码生成领域,Anthropic的Claude模型在效果和综合成本效益上显著优于谷歌Gemini[12] * 模型迭代:Gemini大版本迭代周期通常以0.5为单位,例如2026年上半年发布3.5,预计年底发布4.0[20] 其他重要信息 * 算力消耗构成:当前整体算力需求中,推理约占60%,训练约占40%[28] * 电力瓶颈缓解:预计2027年起,新一代液冷数据中心规模化交付将极大改善电力供应紧张状况,但电力仍是制约因素之一[1][8][24] * 存量算力续约影响:首批H100三年期预留合同将于2026年Q4密集到期,续约提价(如涨30%)预计从2026年Q4到2027年Q2对AI算力利润率产生积极影响[22] * 小规模算力卡:如RTX系列的小算力卡供应也已基本耗尽,目前仅剩几百张零散资源[17] * 中国模型出海:海外云厂商引入中国模型主要基于其性能提升和市场需求,短期内不会对Anthropic等顶级模型的价格体系构成冲击[28]
头部云厂专家交流