中金 | AI进化论(18):谷歌引领ASICs自研加速,异于GPGPU架构的硬件价值再定义
谷歌谷歌(US:GOOG) 中金点睛·2025-12-09 07:37

文章核心观点 - Google TPUv7的推出标志着ASIC集群在异于传统GPGPU的架构上加速自研,带来了硬件价值的异构与重塑 [2] - TPUv7的架构演进有望加速AI算力硬件如PCB、液冷、电源等市场规模量价齐升 [2] - 展望2027年,AI PCB、液冷、电源芯片市场规模有望分别达到216.5亿美元、201.8亿美元和183.9亿美元 [2][4] 谷歌TPU架构演进 - 自2016年TPU v1发布以来,谷歌TPU经历了十年演进,从推理专用的脉动阵列发展至近万卡集群的训练芯片 [3] - TPU v4是架构分水岭,首次引入OCS光交换架构,支持构建4,096芯片集群,用光纤取代铜缆 [8] - TPU v5p重点解决“存储墙”,升级至HBM3,单芯片带宽达4.8 TB/s,算力459 TFLOPS [9] - TPU v6进一步优化稀疏计算,峰值算力较v5e提升4.7倍,适配万亿参数MoE模型 [9] - TPU v7采用双芯粒封装,单设备显存增至192GB,带宽突破7.4 TB/s,FP16/BF16峰值算力较v5p提升超2倍 [10] - 预计TPU v8将于2027年面世,包含TPU 8AX和TPU 8X两个版本,采用N3E/N3P工艺,HBM堆栈升级至12层 [11] TPUv7硬件架构与价值量拆解 - 机柜方案:基于OCP Open Rack v3规范,包含16个计算托盘和16个主机托盘,TPU与CPU分离设计 [12] - 电源架构:采用+/- 400V高压直流方案,三相416V/480V交流电直接进柜,无需传统PDU降压 [3][12] - 散热方案:采用100%液冷架构,大冷板覆盖4颗TPU及VRM [3] - 集群规模:最大支持144个机架互联,即9,216个TPU芯片集群 [3][12] - 单机柜价值量:TPU、PCB、液冷、电源、线缆价值量分别为54.4万、4万、7万、7.1万、0.4万美元,合计约73万美元 [4] PCB市场 - 技术升级:TPUv7采用双芯粒设计,对PCB层数、信号完整性和散热要求提升,预计采用36/38层或更高多层板,需满足7.4TB/s带宽及224Gbps传输速率 [19] - 面积与单价:单块PCB面积或超500mm*600mm,参考英伟达高多层板,预计单价达1.4万元人民币 [19] - 单机柜价值量:预计单机柜PCB价值量达约28万元人民币,对应单TPU的PCB价值量约4,495元人民币 [19] - 未来趋势:TPU v8有望引入M9 44层高多层板或高阶HDI,单TPU对应PCB价值量预计提升至少20%以上,达约750美元 [20] - 市场规模预测:2027年谷歌对AI PCB采购规模有望达36.86亿美元;整体AI PCB市场规模(含英伟达等)2025/2026/2027年有望达56.3亿/120.3亿/216.5亿美元,同比增长110%/114%/80% [4][38] 液冷市场 - 技术方案:TPUv7采用全栈液冷,芯片级覆盖定制冷板,机架级集成分配歧管,支持智能流量调控,温差控制精度较行业标准提升50% [25] - 价值量:参考NVL72 GB200方案,按同功耗比例测算,TPU v7机柜液冷价值量约7万美元;TPU v8机柜液冷价值量有望提升20%达8.5万美元 [39] - 市场规模预测:20252027年Google液冷市场规模有望达2.1亿/20.5亿/60.6亿美元;整体AI液冷总市场规模2025/2026/2027年有望达33.9亿/101.9亿/201.8亿美元 [39][40] 服务器电源市场 - 架构变化:TPUv7采用±400V高压直流分布式架构,机架级交流转直流后,板级通过总线转换器降压,芯片级采用垂直供电技术 [32] - 价值量测算:以NVIDIA NVL72 GB300电源系统单位价值量0.54美元/W为基准进行测算 [41] - 市场规模预测:20252027年Google电源芯片市场规模分别为4.7亿/14.15亿/31亿美元;整体芯片口径电源总市场规模2025/2026/2027年有望达54.4亿/98.3亿/183.9亿美元 [41] 先进封装 - 当前工艺:TPU v7采用CoWoS-S封装技术,集成双逻辑计算芯粒与8颗HBM3e [33] - 未来规划:出于供应能力与成本考量,谷歌计划于2027年的TPU v9芯片中导入英特尔EMIB先进封装试用 [33] - EMIB优势:成本与良率更优,支持超大封装尺寸,热膨胀系数匹配更佳 [36]