成本暴降70%!谷歌TPU强势追赶,性价比已追平英伟达

核心观点 - AI芯片行业竞争焦点正从追求峰值算力转向追求推理成本效率 市场关注点从“谁算得更快”转向“谁算得更便宜、更可持续” [1][2] - Google/Broadcom的TPU在推理成本上实现显著跃升 TPU v7相比v6单位token推理成本下降约70% 使其在绝对成本层面与英伟达GB200 NVL72基本持平甚至略具优势 [1] - 英伟达仍保持产品迭代节奏和生态优势 但AI芯片的评价体系已发生根本性变化 成本曲线斜率成为决定产业格局的关键变量 [2][5][7] AI芯片竞争评价标准切换 - 行业从训练算力主导转向推理成本效率主导 随着大模型进入部署与商业化阶段 推理负载远超训练 成本问题被迅速放大 [3] - 芯片性价比由系统层面效率共同塑造 包括算力密度、互联效率、内存带宽及能源消耗等多重因素 [3] - 基于推理成本曲线 Google/Broadcom TPU在成本维度已可与英伟达正面竞争 而AMD和亚马逊Trainium的单位推理成本仍明显高于前两者 对主流市场冲击有限 [3] TPU成本跃迁的驱动因素 - TPU v7大幅降本源于系统级优化能力 而非单一技术突破 未来推理成本下降将越来越依赖“计算相邻技术”进步 [4] - 系统优化包括更高带宽更低延迟的网络互联、HBM和存储方案持续集成、先进封装技术以及机架级解决方案在密度与能效上的提升 [4] - TPU在谷歌内部使用比例持续上升 并获外部客户采纳 典型案例为Anthropic向Broadcom下达的约210亿美元订单 相关产品预计2026年中开始交付 [4] 主要厂商竞争态势与投资含义 - 英伟达掌握“上市时间”优势 在TPU v7追平GB200 NVL72时 已推进至GB300 NVL72 并计划在2026年下半年交付VR200 NVL144 [5] - 高盛维持对英伟达与Broadcom的买入评级 认为两者最直接绑定AI资本开支中可持续部分 并将长期受益于网络、封装和系统级技术升级 [7] - 高盛将Broadcom 2026财年每股收益预期上调至10.87美元 较市场一致预期高出约6% 认为市场低估其在AI网络与定制计算领域的长期盈利能力 [7] - AMD基于MI455X的Helios机架方案预计在2026年末 有望在部分场景实现约70%的推理成本下降 存在后发优势可能性 [7] - 产业呈现分工图景 GPU继续主导训练与通用算力市场 定制ASIC在规模化、可预测的推理负载中不断渗透 英伟达的CUDA生态与系统级研发投入构成护城河 [7]

Nvidia-成本暴降70%!谷歌TPU强势追赶,性价比已追平英伟达 - Reportify