光互连(ICI)技术
搜索文档
SemiAnalysis深度解读TPU--谷歌冲击“英伟达帝国”
硬AI· 2025-11-29 23:20
市场格局转变 - 2025年AI芯片市场处于微妙转折点,英伟达凭借Blackwell架构维持技术和市场份额的绝对领先,但谷歌TPU的全面商业化正对其定价权构成挑战[1][2] - OpenAI仅凭“威胁购买TPU”这一筹码,就迫使英伟达生态链做出实质性让步,使其计算集群的总拥有成本(TCO)下降约30%[2] - 谷歌正式从“云服务商”转型为直接向外部出售高性能芯片与系统的“商用芯片供应商”,Anthropic高达1GW的TPU采购细节曝光标志着这一战略转变[3] - 当谷歌愿意开放软件生态并提供金融杠杆时,英伟达高达75%的毛利率神话便不再牢不可破[3][7] 重大交易与商业模式创新 - Anthropic确认将部署超过100万颗TPU,此交易采用“混合销售”新模式,首批约40万颗最新的TPUv7 "Ironwood"由博通直接出售给Anthropic,价值约100亿美元[8] - 剩余60万颗TPUv7通过谷歌云进行租赁,估计这部分交易涉及高达420亿美元的剩余履约义务(RPO),直接支撑了谷歌云近期积压订单的暴涨[9] - 谷歌通过“资产负债表外”的信贷支持(IOU)解决AI基础设施建设的期限错配问题,承诺如果中间商无法支付租金,谷歌将介入兜底[16] - 这一金融工具打通了加密货币矿工与AI算力需求之间的堵点,构建了独立于英伟达体系的低成本基础设施生态[17] 技术优势与成本竞争力 - 谷歌TPUv7在成本效率上对英伟达构成碾压优势,从谷歌内部视角看,TPUv7服务器的TCO比英伟达GB200服务器低约44%[13] - 即便加上谷歌和博通的利润,Anthropic通过GCP使用TPU的TCO,仍比购买GB200低约30%[13] - 谷歌通过极致的系统设计弥补单芯片理论算力的不足,TPUv7采用更务实的设计哲学,通过更高的模型算力利用率(MFU)来提升实际产出[20] - 谷歌独步天下的光互连(ICI)技术利用自研的光路交换机(OCS)和3D Torus拓扑结构,允许单个TPUv7集群扩展至惊人的9,216颗芯片,远超英伟达常见的64或72卡集群[23][24] 软件生态战略调整 - 谷歌软件团队的KPI已发生重大调整,从“服务内部”转向“拥抱开源”,全力支持PyTorch Native在TPU上的运行[30][31] - 谷歌不再依赖低效的Lazy Tensor转换,而是通过XLA编译器直接对接PyTorch的Eager Execution模式,使Meta等客户可几乎无缝迁移代码到TPU[33] - 谷歌开始向vLLM和SGLang等开源推理框架大量贡献代码,打通了TPU在开源推理生态中的任督二脉[34] - 这一转变意味着英伟达最坚固的“CUDA护城河”,正在被谷歌用“兼容性”填平[36] 行业影响与竞争态势 - 除了Anthropic,Meta、SSI、xAI等顶级AI实验室也出现在了谷歌TPU的潜在客户名单中[10] - 面对谷歌的攻势,英伟达罕见地展现出防御姿态,其财务团队近期针对“循环经济”的质疑发布长文辩解,显示谷歌的攻势已触及英伟达的神经[10] - Gemini 3和Claude 4.5 Opus这两大全球最强模型均完全在TPU上完成预训练,这为TPU系统处理最高难度任务的能力提供了终极背书[26] - 谷歌在外部客户定价上需要“穿针引线”,但对Anthropic等旗舰客户仍能提供有竞争力的价格,同时保持比商品化GPU交易更优越的息税前利润率[92][93]