Workflow
下一代智算网络
icon
搜索文档
一文读懂“谷歌链”:AI全栈式创新,TPU+OCS共塑下一代智算网络
美股IPO· 2025-11-25 18:17
TPU v7"Ironwood"放量:ASIC市场的主导力量 中泰证券认为,谷歌AI已围绕芯片(TPU)—网络(OCS)—模型(Gemini)—应用(云计算/搜索/广告等)全栈优势构筑护城河。 中泰证券认为,本轮"谷歌链"爆发的关键技术变量在于OCS光交换技术的全面引入。本质上是用物理光路直接传输数据,彻底抛弃了"光—电— 光"的信号转换过程。通过深度整合自研TPU芯片与OCS(光电路交换机)技术,谷歌不仅突破了传统数据中心的能效与扩展瓶颈,更为下一代 智算网络确立了新的架构标准。谷歌已围绕芯片(TPU)—网络(OCS)—模型(Gemini)—应用(云计算/搜索/广告等)全栈优势构筑AI护城河。 在AI军备竞赛日益白热化的背景下,谷歌正凭借其从芯片到网络的"全栈式"创新构筑独特的算力护城河。 在中泰证券看来,这一轮"谷歌链"爆发的关键技术变量在于OCS光交换技术的全面引入。通过深度整合自研TPU芯片与OCS(光电路交换机) 技术,谷歌不仅突破了传统数据中心的能效与扩展瓶颈,更为下一代智算网络确立了新的架构标准。 TPU与OCS的深度耦合,不仅支撑了Gemini等大模型的高效迭代,也直接带动了上游光模块(特别是 ...
一文读懂“谷歌链”:AI全栈式创新,TPU+OCS共塑下一代智算网络
华尔街见闻· 2025-11-25 16:25
文章核心观点 - 谷歌通过整合自研TPU芯片与OCS光交换技术,构建从芯片到网络的“全栈式”AI算力护城河,推动AI数据中心架构向动态光子互联演进 [1][3] TPU v7 (Ironwood) 芯片进展 - 即将全面上市的TPU v7在性能上实现质的飞跃,单芯片计算能力较上一代TPU v5p提升超过十倍,峰值带宽达7.4 TB/s [4] - TPU v7集群采用3D Torus拓扑结构,单集群规模可扩展至9216颗芯片,并开始配置1.6T光模块 [4] - 供应链调研指出,2026年谷歌TPU将成为全球自研ASIC市场主力,出货量远高于AWS Trainium或Microsoft Maia等竞品 [6] - 受英伟达GB200与谷歌TPU v7双重拉动,2026年行业1.6T光模块需求有望上修至2000万只以上 [6] OCS光交换技术优势 - 谷歌大规模引入OCS旨在解决大规模扩展带来的功耗与效率难题,替代面临严重功耗散热问题和昂贵布线成本的传统电分组交换机 [8] - OCS通过物理光路直接传输数据,摒弃“光—电—光”转换过程,是实现服务器解耦、允许计算资源跨机架动态编排的关键 [8] - 采用OCS后,谷歌网络吞吐量提升30%,功耗降低40%,网络宕机时间减少50倍,资本开支减少30% [11] - 在Ironwood集群中,48台OCS交换机连接了9216个TPU芯片,构建低延迟、高带宽的动态光子网络 [8] OCS技术构成与产业链影响 - 谷歌主流的Palomar OCS基于MEMS方案,拥有136个光路通道,通过2D MEMS微镜阵列反射光信号实现毫秒级光路切换 [14] - 谷歌在光模块中内置环形器,实现单根光纤双向传输,使所需端口和光缆数量比传统胖树架构减少40% [15] - OCS创造了对MEMS阵列、准直器、2D透镜阵列等高价值精密光学元器件的需求 [15] - 除MEMS方案外,谷歌正在探索液晶、压电陶瓷和硅光波导等新技术路径 [15] - Lightcounting预测2024-2029年OCS市场将以28%的复合增速增长,行业迎来技术与需求双重爆发期 [17] 谷歌全栈AI布局 - 公司已形成从芯片(TPU)到网络(OCS)、模型(Gemini)、应用(云计算/搜索/广告)的全栈优势布局 [3] - 自2011年成立谷歌大脑实验室以来,通过一系列AI研究(如2017年发布Transformer架构)将AI整合到多元业务流程中,获取海量训练数据 [3]