AI数据中心的光学革命:从铜缆到光的730亿美元市场机遇
傅里叶的猫·2026-03-11 23:51

文章核心观点 - AI训练集群的规模与带宽需求正推动数据中心互连技术从铜缆向光学方案加速演进,预计到2030年,AI光学网络市场规模将达到730亿美元,占整个AI网络市场的近40% [1] - 技术路线呈现多元化发展,传统可插拔光模块在未来5年内仍将占据主导,但共封装光学(CPO)作为革命性方案,预计将在2027-2028年后起量,并打开全新的Scale-up网络市场 [3][7][16][28][29][48] - 行业需求强劲且产能紧张,未来3-5年内产业链各环节厂商均有望受益,呈现“水涨船高”的格局 [45][46] 一、光学技术重要性提升的背景 - 传统规则被打破:数据中心互连曾遵循“能用铜就用铜”的原则,但AI改变了游戏规则 [1] - 铜缆的三大瓶颈: - 距离限制:高速率下直连铜缆(DAC)传输距离仅约2米,有源铜缆(ACC)也无法满足跨机架需求 [2] - 带宽压力:AI网络带宽需求每两年翻一番,铜缆在800G、1.6T及更高速率下信号衰减严重 [2] - 功耗挑战:Nvidia下一代Rubin架构单机架功耗达1兆瓦,若使用传统光模块,其功耗可能占总功耗的40% [2] - 光学技术趋势:光学技术正从原有应用领域向铜缆主导的领域扩张,预计到2030年,光学端口将占总端口数的71%,铜缆降至29% [3][5] 二、光学收发器(传统光模块) - 市场前景乐观:尽管存在功耗高的质疑,但传统可插拔光模块在未来5年内仍将占据主导,其市场规模预计从2025年的126亿美元增长至2030年的454亿美元,年复合增长率达29% [7] - 持续增长的动力: - 需求周期延长:AI驱动下,800G光模块从2023年放量,预计增长期长达5年至2028年达峰值,1.6T与3.2T将遵循类似模式 [8] - 产能紧张:行业产能紧张且扩产周期长,有利于价格维持;大客户采用新技术节奏不同,使得不同代际产品可共存 [9] - 技术优势明显:光模块具有灵活可替换、易于升级、厂商产品互通性好以及散热处理方便等优点 [9] - 激光器技术路线: - VCSEL:800G时代主力,成本与功耗低,适合50米内短距传输,但主要支持100G/通道 [12] - EML:高端市场主角,支持100米至40公里距离,200G/通道产品正支撑1.6T部署,但产能紧张且价格昂贵(单颗10-15美元) [12] - CW激光器:配合硅光子技术使用,成本可控且单激光器支持更多通道,因EML紧缺而受关注 [13] - 硅光子趋势:硅光子技术在光模块中的占比预计将从2025年的38%大幅提升至2030年的84% [13] 三、LPO/LRO(线性可插拔/接收光学) - 技术原理:通过去除或部分去除光模块中的数字信号处理器(DSP),将功耗从传统方案的15 pJ/bit降低至6-10 pJ/bit [14] - 局限性:依赖交换机芯片能力、缺乏统一标准导致互通性差、缺少诊断监控功能 [15] - 市场定位:被视为利基市场,主要在1.6T(200G/通道)节点有所应用,预计2030年市场规模约50亿美元,占整个光学市场个位数百分比;到3.2T时代将被CPO取代 [15][16] 四、CPO(共封装光学) - 核心思路:将光学器件直接集成到交换机芯片的封装基板上,而非插在面板上,是架构层面的根本性变革 [17] - 解决传统架构痛点:传统架构中信号从芯片到光模块路径损耗可达20多dB,需高功耗DSP补偿;Nvidia数据显示,传统光模块连接大规模AI集群时,光学收发器功耗可达传统数据中心的10-20倍,或占总算力功耗的10% [18][19] - 性能优势: - 降低损耗与功耗:信号路径极短,损耗从20多dB降至1-2dB,功耗从15 pJ/bit降至5 pJ/bit或更低 [20] - 具体案例:Nvidia的Spectrum-X CPO交换机信号损耗仅4dB,功耗9瓦(传统方案需30瓦);Broadcom称可节省3.5倍功耗 [20] - 提升带宽密度:集成封装可实现每平方毫米1Tbps以上的带宽密度,突破面板空间限制 [22] - 推广障碍的克服:早期受可靠性、灵活性差及供应链不成熟制约;现Meta测试数据显示Broadcom CPO交换机平均故障间隔时间超250万小时,可靠性高于最可靠的光模块,且可插拔外部光源设计缓解了维护顾虑 [24][25][26][27] - 市场空间: - CPO光学器件市场预计2028年达29亿美元,2030年达150亿美元;包含交换机的整体市场规模2030年达244亿美元 [28] - 开辟新市场:CPO将打开Scale-up网络(服务器内部加速器互连)市场,预计2030年规模达94亿美元,超过Scale-out(服务器间连接)的56亿美元,此为纯增量市场 [29][30] - 主要玩家策略: - Broadcom:最激进的推动者,已推出第三代产品,Meta为主要客户 [31] - Nvidia:InfiniBand与以太网路线并行,采用台积电COUPE封装工艺实现高集成度,产品预计2026年商用 [31] - Marvell:通过收购Celestial AI进入市场,技术可直接封装于AI加速器上,亚马逊为首个客户,预计2027年大规模部署,2029财年第四季度相关营收目标达10亿美元 [31] 五、OCS(光电路交换机) - 市场预测:市场规模预计从当前约10亿美元增长至2030年的40亿美元 [33] - 解决传统交换机痛点:传统电路交换需逐包处理,增加延迟与算力消耗,且固定拓扑难以适应AI训练流量的动态模式 [34] - 工作原理与优势:通过MEMS镜面或液晶技术物理改变光路方向,实现光信号直通 - 延迟极低:达纳秒级 [36] - 功耗低:无需电路交换算力 [37] - 灵活可靠:可动态重构拓扑,纯光路径故障点少 [38][39] - 应用场景:作为传统交换网络的补充、用于Google TPU集群等Scale-up网络、以及灾备冗余;随着AI集群规模超10万节点,其经济性优势将更明显 [40][41][42] 六、投资机会与关注公司 - 行业格局:需求强劲叠加产能扩张周期长,未来3-5年产业链各环节有望普遍受益,非零和游戏 [45][46] - 重点推荐公司: - Marvell (MRVL):在DSP芯片市场地位强,800G向1.6T升级带来量价齐升;通过收购在CPO领域竞争力增强,已获亚马逊大单 [44] - Lumentum (LITE):激光器龙头,EML市场份额占50%,CPO所需的高功率CW激光器主要供应商,拥有磷化铟产能 [44] - Coherent (COHR):激光器大厂,正在扩张磷化铟基板产能,在VCSEL和EML有布局,垂直整合能力强 [44] - Nvidia (NVDA) 与 Broadcom (AVGO):交换机芯片主要玩家与CPO技术推动者 [44] - Macom (MTSI):LPO/LRO芯片供应商,把握细分增量机会 [44] 七、行业观察与思考 - 技术演进加速:光模块升级周期从5-7年缩短至不到3年,考验供应链响应能力 [48] - AI重塑产业链:光学器件等此前边缘的领域正被AI需求强力带动 [48] - 竞争门槛高:激光器、硅光子等领域需要长期技术积累与大量资本投入,竞争主要在现有玩家之间 [48] - 网络是关键基础设施:高性能光学互连是发挥AI算力的基础,虽非最大市场环节,但不可或缺 [48][49]