Workflow
AI Data Center Optical Interconnect
icon
搜索文档
OFC 2026 展望:从可插拔光器件与光子引擎(PO)到 CPU 及其他终端设备的 AI 数据中心光互连趋势-OFC 2026 Outlook_ AI Data Center Optical Interconnect Trends from Pluggable Optics and LPO to CPO and MicroLED
2026-03-12 17:08
涉及的行业与公司 * **行业**:AI数据中心光互连行业,涵盖光模块、硅光、激光器、先进封装与测试等领域 [1][7][10] * **提及的公司**: * **网络/交换芯片与系统厂商**:英伟达 (NVIDIA)、博通 (Broadcom)、美满电子 (Marvell)、思科 (Cisco) [8][72][74] * **光模块/组件厂商**:中际旭创 (Accelink)、Lumentum、Coherent、Avicena、Ayar Labs、Lightmatter、英特尔 (Intel) [12][29][33][63][74][81] * **半导体与制造**:意法半导体 (STMicroelectronics)、台积电 (TSMC)、Credo Technology Group [25][63][67] * **测试设备厂商**:ficonTEC、泰瑞达 (Teradyne) [38][48] 核心观点与论据 1. AI驱动光互连技术演进:从可插拔到共封装 * **核心瓶颈转移**:生成式AI模型快速扩展,数据中心主要瓶颈正从晶体管性能转向互连带宽和延迟,形成“I/O墙” [4] * **铜缆物理限制**:在每通道200 Gb/s速率下,铜缆物理特性成为限制因素,传统无源铜缆无法再跨越单个服务器机架,有时甚至在机架内部也受限 [6] * **技术演进路径**:行业正经历从**可插拔光模块 (Pluggable)** → **线性可插拔光模块 (LPO)** → **共封装光学 (CPO)** 的演进 [14] * **可插拔光模块 (主流)**:集成DSP进行信号调理,提供稳健互操作性,但功耗和热密度较高 [17] * **线性可插拔光模块 (LPO)**:移除DSP,依赖高质量SerDes和线性驱动以降低功耗和延迟,但对通道要求更严格 [18] * **共封装光学 (CPO)**:将光引擎置于交换ASIC封装附近,博通声称其每个800G端口的功耗约为5.5 W,而同等可插拔模块约为15 W,端口级功耗降低约3倍 [19] * **CPO采用时间表**:尽管英伟达计划在2026年前在网络交换芯片中使用光技术,但由于可靠性与可维护性担忧,以及铜缆在某些领域已证实的稳健性,广泛采用(尤其是靠近GPU)可能要到2028年之后 [20] 2. 市场现状与技术发展:800G迈向主流,1.6T开始上量 * **800G/1.6T发展**:800G正从试点走向主流;1.6T开始进入生产爬坡阶段,行业跟踪显示2025年800G增长强劲,下半年开始向1.6T光学器件迈进 [12] * **产品进展**:中际旭创已公开展示/送样针对AI数据中心需求的1.6T OSFP224 DR8收发器 [12] * **标准制定**:IEEE的802.3dj工作(覆盖高达1.6T的200G/通道)据报道将于2026年底完成,这是推动1.6T更大规模量产的关键催化剂 [13] 3. 供应链价值转移与激光器瓶颈 * **供应链价值转移**: * **可插拔时代**:价值集中在收发器供应商、光学组件供应商和DSP/AFE IC供应商 [24] * **LPO时代**:价值向SerDes、通道工程和系统协同设计转移 [25] * **CPO时代**:封装、测试、激光器和光学附着成为战略瓶颈,压缩了“网络硅”和“光学”之间的界限 [25] * **激光器供应瓶颈**: * **EML短缺**:电吸收调制激光器 (EML) 制造难度大,供应商基础小,AI数据中心的需求激增造成了激光光源的主要上游瓶颈,英伟达已确保关键EML供应商的大部分产能,导致交货期延长至2027年以后,并加剧了全球短缺 [26][29] * **替代方案加速**:超大规模企业和模块制造商正在加速替代架构,特别是**外部连续波 (CW) 激光器 + 硅光调制器**,以拓宽供应商池 [31] * **高功率CW激光器需求**:CPO架构需要克服连接器/分路器/耦合器的损耗并保持链路裕量,因此行业正推动相关波段激光器达到数百毫瓦的功率水平 [32] * **产能扩张**:Coherent宣布了6英寸磷化铟 (InP) 晶圆制造能力,强调每片晶圆器件数量增加约4倍,芯片成本降低超过60%,并明确将高速EML、光电探测器和用于CPO/硅光的高功率CW激光器列为正在该6英寸平台上认证的产品系列 [33] 4. CPO测试成为关键瓶颈与解决方案 * **测试重要性凸显**:在CPO中,光引擎与交换/ASIC位于同一封装区域,许多组件无法现场更换,这使得测试、筛选和过程控制成为良率、可靠性以及最终每Tb/s交付成本的首要决定因素 [38][42] * **测试挑战**:不良的光引擎可能导致昂贵的组件报废,缺陷筛选必须提前(晶圆/芯片级)并更全面,生产需要并行化以控制测试成本 [46] * **测试设备进展**: * ficonTEC推出DLT-D1多站点芯片级测试仪,用于双面紧凑型3D CPO光引擎,旨在将测试从实验室设置转向高吞吐量制造 [44] * ficonTEC推出300毫米双面光电晶圆测试仪概念,旨在实现高容量晶圆探测 [45] * 泰瑞达宣布与ficonTEC合作,推出用于硅光的高容量双面晶圆探针测试单元,明确受CPO需求驱动,这意味着CPO测试正趋同于半导体式ATE生态系统 [48] 5. 短距/超短距互连:VCSEL与MicroLED的竞争 * **VCSEL (垂直腔面发射激光器)**: * 成熟技术,适用于短距离(≤几百米),850 nm VCSEL + 多模光纤是短距离数据通信互连的主导解决方案 [52] * 博通的组件组合明确将850 nm VCSEL定位用于高性能短距离数据网络 [55] * **MicroLED (微发光二极管)**: * 新兴竞争者,旨在在超短距离“取代激光器”,LED不需要激光阈值电流,可通过大规模并行通道扩展带宽,从而可能降低系统级的每比特能耗 [56][58] * **微软MOSAIC方案**:采用“宽而慢”理念,使用数百个低速通道而非几个超高速通道,例如假设每个MicroLED通道2 Gb/s,一个20×20的MicroLED阵列(面积<1 mm × 1 mm)可构建800 Gb/s链路,据称其架构框架中可实现高达68%的功耗降低和约10倍于铜缆的传输距离 [59] * **Avicena LightBundle**:基于MicroLED的互连平台,声称I/O密度>1 Tb/s每毫米“海岸线”,传输距离>10米,互连能效<1 pJ/比特,在SC25上演示了以4 Gb/s每通道运行,原始误码率达1×10⁻¹²,每LED约80 fJ/比特,且无需前向纠错 [63][64][68] * **竞争态势**:VCSEL凭借成熟度、批量制造和已知的可靠性在当前胜出;MicroLED则凭借通过(1)无阈值电流行为和(2)并行性(尤其是与CMOS兼容的PD阵列和先进键合配对时)来降低每比特能耗的潜力而具有优势 [69] 6. 扩展 (Scale-out) 与扩展 (Scale-up) 网络架构 * **扩展网络 (机架到机架)**:领先的交换生态系统参与者包括英伟达、博通、美满电子和思科,随着AI集群扩展,各自都在推动51.2T → 102.4T级别的交换芯片和系统,例如思科已公开宣布其用于AI后端网络的Silicon One G300 (102.4 Tbps) [72] * **扩展网络 (GPU到GPU / 节点内)**:行业正积极探索OIO/CPO风格的光链路,以减少NVLink级铜缆的功耗和距离限制,该方向常被引用的公司包括Ayar Labs、美满电子、Lightmatter和英特尔 [74] 7. 前沿趋势:LPO、CPO、OIO路线图与“量子互连” * **LPO市场**:在本十年内仍将是一个巨大的市场,随着交换芯片进入102.4T及以上,可插拔生态系统仍然是默认的采用路径,因为它保留了现场可更换模块模式,这对于优化平均修复时间和供应链灵活性的超大规模企业非常重要 [75][78] * **CPO量产时间**:严重受测试吞吐量和已知良品芯片 (KGD) 可用性的制约,博通广泛引用的功耗数据说明了行业持续推动的原因:CPO每个800G端口约5.5 W,而同等可插拔模块约15 W,端口级降低约3倍 [79] * **OIO (光学I/O)**:Ayar Labs将其定位为“封装内”光学I/O策略,可将光链路带到小芯片海岸线,旨在实现与距离无关的带宽扩展,其TeraPHY光学I/O小芯片支持UCIe标准封装电气接口,公开描述带宽达8 Tbps,采用16波长WDM架构 [81][83][86] * **“量子互连” (如NVQLink)**:最好理解为量子-经典系统接口,而非AI训练结构中GPU到GPU NVLink的近期直接替代品,量子优势取决于算法和纠错,商业影响力取决于保真度的持续改进和可扩展架构 [87][89][94] 其他重要内容 * **硅光生态发展**:硅光势头在整个生态系统中加速,例如路透社报道意法半导体与AWS合作开发了用于收发器的数据中心光子芯片,突显主流半导体玩家正深入光子领域 [25] * **可靠性挑战**:激光器和光电二极管通常是光学系统中最薄弱的环节,在AI集群中热密度上升和维护窗口缩短时尤其关键,锗基光电二极管被强调为光子系统中故障率最高的子组件之一 [35][36] * **CPO对可靠性的影响**:CPO可以移除一些现场可更换的光学部件,并转向晶圆级测试和外部激光器策略,但同时也引入了新的可靠性因素,如封装级热机械应力、更高密度下的光学附着和连接器可靠性以及可维护性权衡 [37][40] * **MicroLED的挑战**:MicroLED互连的成功关键不在于LED本身,而更多在于阵列均匀性、键合良率、接收器灵敏度、封装/耦合以及大规模测试,这再次印证了光学测试/组装工具在光学器件进入封装/板级时变得具有战略性 [66] * **企业战略动向**:2025年9月,Credo Technology Group收购了Hyperlume,将其Micro-LED光互连技术与Credo的端到端系统级连接解决方案整合,以加速向下一代AI数据基础设施高速互连技术的扩张 [67][70]