头部云厂专家交流

行业与公司 * 涉及的行业为AI算力与云计算行业，核心公司为谷歌及其云平台GCP，同时涉及Meta、Anthropic、OpenAI、苹果、字节跳动、MiniMax等主要AI模型与科技公司[1][2][10][11] * 涉及的硬件包括谷歌的TPU系列（v7, v8, B200, B300, VR系列）、英伟达的GPU系列（H100, RTX系列）以及谷歌的视频生成模型VLOGGER[1][3][6][14][17][22] AI算力供需与价格 * 供需极度失衡：AI算力整体需求约为供给能力的十倍，紧张态势预计持续至2026年下半年，短期内无显著改善[1][4] * 租赁价格飙升： * B200芯片三年期预留价格从2025年底的3.0-3.3美元/小时上涨至2026年的6美元/小时，实现翻倍[1][3] * B200一年期预留价格超过7美元/小时[5] * H100芯片三年期预留价格从2025年底的1.8-1.9美元/小时低点，上涨至当前约3.5美元/小时或更高，同样翻倍[3][4][16] * 老客户H100续约价格普遍上涨30%以上，新客户基本按列表价销售，折扣极少[4] * 供应紧张原因：瓶颈从电力转向CPU、内存及封装等供应链环节，例如谷歌内部超过5万核（约一百多台服务器）的CPU需求需副总裁级审批[1][7] * 未来价格预期：计划于2027年交付的VR系列芯片价格预计将上调，TPU v8价格预计比早期预期上涨20%-30%[6][14] 主要云厂商（谷歌）动态与策略 * 内部资源矛盾：谷歌存在自有业务（如DeepMind模型训练、搜索、YouTube）与对外租赁服务之间的显著资源冲突，影响了Gemini模型的迭代速度[2][10] * TPU供给与分配： * 2026年谷歌整体TPU供给量预计为400-450万颗，其中仅约100-150万颗对外提供，GPU供给为几十万颗规模[2] * 对外供给中，Anthropic和Meta是核心客户，Anthropic在2026年向谷歌下达了约100万颗芯片订单[2] * 2027年TPU出货量预期上调至1200万颗，但谷歌自有数据中心无法完全承载，部分将通过NewCloud模式交付[9] * 模型定价策略：云厂商通过推出参数更小的“Light”或“Flash”模型实现名义降价，实则通过版本迭代维持并提升模型业务利润率[1][13][14][23] * 资本支出与战略：云厂商共识是未来一两年将继续增加资本支出以换取算力，支持模型研发并扩大云业务利润，例如谷歌近期筹集800亿美元资金主要投向未来Capex[25] 主要客户动态 * Meta： * 是谷歌Gemini模型的全球前三API调用客户，AI算力使用量排名低于Anthropic和苹果，但预计2027-2028年将成为GCP前三算力客户[3] * 调用量增长斜率很高，导致Gemini推理资源不堪重负，其服务被中断事件反映了算力资源的普遍紧张[2][10] * Anthropic： * 在2025年底提前激进购买了大量算力资源，使其在2026年算力短缺中占据优势，是一次成功的豪赌[2][11] * 在编程等垂直领域模型表现领先于谷歌Gemini，市场认可度高[11][12] * 客户结构：TPU头部客户集中度极高，主要大客户数量在十个以内，且锁定了绝大部分产能，2026年已无TPU v7芯片余量可供销售[15] 模型竞争格局与发展路径 * 发展路径分化：一派（如谷歌）致力于打造通用多模态大模型；另一派（如Anthropic、字节、MiniMax）专注于编程、视频生成等垂直赛道[11] * 市场反馈：专注于垂直赛道的路径市场认可度更高，通用模型面临客户粘性低、付费意愿不强、易陷入价格战的问题[11] * 具体领域表现：在代码生成领域，Anthropic的Claude模型在效果和综合成本效益上显著优于谷歌Gemini[12] * 模型迭代：Gemini大版本迭代周期通常以0.5为单位，例如2026年上半年发布3.5，预计年底发布4.0[20] 其他重要信息 * 算力消耗构成：当前整体算力需求中，推理约占60%，训练约占40%[28] * 电力瓶颈缓解：预计2027年起，新一代液冷数据中心规模化交付将极大改善电力供应紧张状况，但电力仍是制约因素之一[1][8][24] * 存量算力续约影响：首批H100三年期预留合同将于2026年Q4密集到期，续约提价（如涨30%）预计从2026年Q4到2027年Q2对AI算力利润率产生积极影响[22] * 小规模算力卡：如RTX系列的小算力卡供应也已基本耗尽，目前仅剩几百张零散资源[17] * 中国模型出海：海外云厂商引入中国模型主要基于其性能提升和市场需求，短期内不会对Anthropic等顶级模型的价格体系构成冲击[28]