AI算力竞赛升级,谷歌发布下代Ironwood TPU架构,性能暴增16倍,单芯片算力达4614 TFLOPs
核心观点 - AI基础设施军备竞赛升级 谷歌发布第七代TPU架构Ironwood 单芯片算力达4614 TFLOPs 较TPU v4提升超16倍 较TPU v5p提升近10倍 [1][5] - Ironwood是完整系统级解决方案 包含芯片 机架 网络互连和冷却系统 展示全栈能力 [4] 性能规格 - 单芯片峰值算力4614 TFLOPs 配备192 GB HBM 带宽7.4 TB/s [5] - TPU v4单芯片算力275 TFLOPs 配备32 GB HBM 带宽1.2 TB/s [5] - TPU v5p单芯片算力459 TFLOPs 配备95 GB HBM 带宽2.8 TB/s [5] - 超级计算集群规模扩大 Ironwood Superpod包含9216颗芯片 [8] 系统架构 - 四颗Ironwood SoC芯片集成于PCBA主板 [11] - 16个PCBA主板堆叠构成64颗芯片的机架 采用4x4x4 3D环面网络拓扑 [14] - 专有芯片间互连技术混合PCB走线 铜缆和光纤链路 [14] - 最多连接43个计算单元形成集群 网络带宽达1.8 Petabytes [14] 能源与冷却 - 单个满载机架功耗超100千瓦 [17] - 配备高效液体冷却系统 包括冷却剂分配CBU机架和防滴漏监测盘 [17] - 采用416伏交流电输入 通过整流器转换为直流供电 [17]