文章核心观点 - 谷歌母公司Alphabet正与Meta Platforms等公司洽谈,计划直接销售其自研的Tensor AI芯片(TPU),此举将加剧与英伟达的竞争 [2] - 谷歌最新一代TPU v7(代号Ironwood)在性能上已与英伟达Blackwell GPU相当,并通过独特的可扩展架构实现超大规模计算集群 [4][5][7] - 谷歌同时推出其首款基于Arm架构的通用处理器Axion,与TPU协同构成完整的AI超级计算机解决方案 [11][12][13] 商业动态与市场影响 - Meta Platforms正考虑从2027年开始在其数据中心购买价值数十亿美元的谷歌TPU,并可能最早从2026年就开始从谷歌云租用TPU容量 [2] - 受此消息影响,谷歌股价在盘后交易中上涨超过2%,博通股价上涨近2%,而英伟达和AMD股价则下跌近2% [2][3] - 博通参与了谷歌Tensor AI芯片的设计,这可能为其开辟一个巨大的新市场 [2] TPU v7 (Ironwood) 技术规格与性能 - 每个Ironwood TPU拥有4.6 petaFLOPS的密集FP8性能,略高于英伟达B200的4.5 petaFLOPS [5] - 芯片配备192 GB的HBM3e内存,提供7.4 TB/s的带宽,与英伟达B200(192GB HBM,8TB/s带宽)处于同一水平 [6] - 性能是TPU v5p的10倍,是TPU v6e "Trillium"加速器的4倍 [6] - 单个Ironwood "模块"可通过专有互连网络连接多达9216个独立芯片,共享1.77PB高带宽内存 [7] 架构与可扩展性优势 - 谷歌采用3D环面拓扑结构进行芯片互连,无需使用昂贵且耗电的高性能数据包交换机 [9] - 系统采用光路交换技术,构成动态可重构架构,能在组件故障时于几毫秒内自动绕过中断点 [8][10] - 液冷系统的整体正常运行时间自2020年以来保持约99.999%的可用性,相当于每年停机时间不到6分钟 [8] - 谷歌报告称其Ironwood Pods的FP8 ExaFLOPS性能是其最接近的竞争对手的118倍 [8] 软件生态系统与客户案例 - 谷歌AI超级计算机客户平均实现了353%的三年投资回报率、降低了28%的IT成本,并提高了55%的IT团队效率 [13] - 推理网关通过前缀缓存感知路由等技术,能将首次令牌延迟降低96%,并将服务成本降低高达30% [13] - 早期客户Vimeo报告其核心转码工作负载性能提升30%,ZoomInfo表示其数据处理管道的性价比提升60% [12] - AI公司Anthropic计划利用多达一百万个TPU来训练和运行其下一代Claude模型 [15] 战略布局与行业影响 - 谷歌推出首款基于Armv9架构的通用处理器Axion,旨在提供比现代x86 CPU提升达50%的性能和高达60%的能效 [11] - 该战略体现了未来的计算基础设施既需要专用AI加速器(TPU),也需要高效的通用处理器(Axion)的信念 [12] - 谷歌、亚马逊等公司的定制芯片在硬件能力和网络可扩展性方面正迅速赶上英伟达,软件成为决定性因素 [16]
谷歌对外销售芯片:博通大涨,英伟达AMD应声下跌
半导体行业观察·2025-11-25 09:20