Workflow
CPO(共封装光器件)
icon
搜索文档
CPO,最新进展
半导体行业观察· 2025-11-03 08:39
共封装光器件(CPO)的驱动因素与优势 - 对更高互连带宽的永无止境的需求是塑造数据中心发展的关键趋势,驱动力来自互联网流量的持续增长和人工智能大型语言模型的快速扩展 [2] - 带宽提升通常伴随功耗增加,预计到2027年,一个英伟达机架的功耗将高达600千瓦,因此业界正寻求以皮焦耳/比特为单位的更高数据传输能效 [2] - 共封装光器件(CPO)正迅速发展,成为网络交换机中传统可插拔光模块的替代方案,通过将电子芯片和硅光子芯片集成在同一封装中,将光纤尽可能靠近ASIC或FPGA,从而显著降低功耗 [2] - 与可插拔模块相比,CPO技术可以节省30%的功耗,降低40%的每比特光器件成本,并实现1 Tbps/mm的带宽密度 [6] - CPO的优势还包括移除高功耗DSP、实现更高带宽和更低延迟、提高前面板连接密度以及改善散热 [6] CPO技术原理与挑战 - 理想的数据中心内部互连应尽可能用光纤替代铜线,并将光纤直接连接到网络交换机核心的硅芯片,以避免铜缆混合互连造成的信号损耗和信号完整性负面影响 [4] - 传统可插拔光模块使用铜线连接前面板和ASIC/FPGA,需要耗电量巨大的基于DSP的重定时器和纠错电路 [4] - 实现CPO面临复杂封装技术、连接器以及板级或机架级空间限制和散热要求的挑战 [4] - CPO发展得益于器件小型化和2.5D-3D封装技术的进步 [6] - 可插拔模块在可维护性方面可能仍有优势,但许多CPO解决方案通过采用可插拔激光源来解决可维护性问题 [6] 主要厂商进展与产品 - 博通的产品系列包括25.6 Tbps的Humboldt CPO交换机器件和51.2 Tbps的CPO以太网交换机Bailly,后者于2024年3月推出,据称可使光互连功耗降低70%,硅面积效率提高8倍 [8] - 思科在2023年OFC上展示了其CPO路由器相比传统路由器的实际功耗降低 [9] - 台积电发布名为COUPE的硅光子解决方案,计划于2026年将其集成到CoWoS封装技术基板上,目标实现功耗降低2倍、延迟降低10倍 [10] - 英伟达在2025年GTC大会上宣布将在其网络交换机中采用CPO技术,并创新性地使用微环调制器,声称其CPO方案可提供3.5倍更高能效、10倍网络弹性以及1.3倍更快部署速度 [12] - 英伟达将使用CPO技术构建其全新的Quantum-X和Spectrum-X硅光子网络交换机,预计分别于2025年晚些时候和2026年上市 [12] 市场预测与测试进展 - 根据Yole Group数据,CPO市场在2022年收入约为3800万美元,预计到2033年将达到26亿美元,2022年至2033年的复合年增长率为46% [14] - LightCounting预测CPO的研发活动正处于历史最高水平,预计2027年将实现大规模部署 [16] - 截至2025年7月7日,博通CPO技术已累计完成超过86,000小时的HTOL压力测试,相当于800G CPO端口550万小时的运行时间,测试显示CPO在"FEC tails"方面性能极其稳定 [18] - 博通CPO在35°C温度下每个端口的功耗稳定在5.5W [19] 技术演进与生态系统 - Coherent公司指出CPO和可插拔收发器针对两个需求不同的市场,高性能插座可以弥合需求差距 [22] - 博通和英伟达目前的CPO设计采用不可插拔(焊接式)CPO引擎以降低损耗,但可插拔CPO(会带来额外1 dB损耗)可能使市场更加开放竞争,Meta和微软等主要客户倡导建立此类生态系统 [25] - Lumentum展示了用于CPO的外部激光源中的高功率CW激光器的性能数据 [26] - Alfalume公司分享了量子点激光器的最新研究成果,其在高温下表现出更优异的性能 [29] - Senko公司讨论了光纤与CPO的连接解决方案,包括可拆卸的光纤芯片连接器 [31] - Poet Technologies和Scintil Photonics等公司介绍了各自在晶圆级集成和封装方面的独特方法 [35] - Avicena公司的二维微型LED阵列解决方案据称可实现5pJ/bit的能效 [36] - Nubis Communications开发了基于高速硅光子技术的二维阵列互连产品,无需齿轮箱 [39] - Celestial AI和LightMatter等初创公司致力于开发更先进的第四代CPO技术,将光互连置于ASIC下方 [41] 博通Tomahawk Ultra交换机 - 博通Tomahawk Ultra交换机是一款专为横向扩展网络设计的新产品,采用与Tomahawk 5 100%引脚兼容的设计,是一款51.2Tbps的交换机 [45] - 该交换机采用单片式设计,共享与TH5相同的512x100Gbps Peregrine SerDes,采用5nm工艺,能够驱动长达4米的DAC或铜质背板 [45] - 为实现250ns的低延迟,博通使用了比TH5更多、更快的包处理流水线,并重新设计了流量管理器和缓冲存储器架构,牺牲了数据包缓冲区大小为网络内集合引擎腾出空间 [46] - TH-U提供最大256个200GbE端口,允许其在单跳中连接多达256个XPU [47] - TH-U支持"扩展以太网"规范所需的功能,如链路层重试和基于信用的流量控制,以实现硬件级可靠性,并支持AI转发报头 [46]