文章核心观点 - 人工智能系统互连架构正经历从铜缆向光互连的演进,但并非简单替代,而是基于传输距离、功耗和延迟等需求形成务实分工[2][11] - 共封装光学器件是解决网络交换层SerDes扩展性、功耗和信号完整性挑战的关键技术转折点,通过将光引擎靠近ASIC封装来优化系统设计[6][7][11] 纵向扩展与横向扩展架构 - 纵向扩展指在紧密耦合系统(如单个服务器或加速器域)内最大化性能,强调极低延迟和高度同步,物理传输距离通常短于十米[3] - 在纵向扩展领域,高速铜缆互连仍占主导,由电串行器/解串器及NVLink等协议支持,铜缆因低延迟、成本优势和规模化可靠性而被NVIDIA等公司继续推广[3][6] - 横向扩展指将工作负载分配到多台服务器以提高系统总吞吐量,当通信范围超出机架或机架行时,光互连变得至关重要[3] - 以太网和InfiniBand构成大规模AI集群骨干网络,在数十米到数百米距离实现高带宽、高能效通信,光插拔设备在连接数据中心网络的二层网络交换机层级占据主导[3][4] 电控SerDes面临的挑战 - 电信号SerDes容量持续从112G向224G PAM4及更高扩展,但电气通道(封装、基板、PCB走线、连接器和电缆)成为瓶颈[4][5] - 为在远距离保持信号完整性,需更强均衡和数字信号处理能力,导致每比特功耗增加和热负载上升[5] - 在拥有数千条SerDes通道的大型AI交换机和加速器架构中,每比特能耗的略微增加可在机架层面转化为数百瓦的功耗,使SerDes成为首要的架构限制因素[5] - 随着交换机ASIC带宽从每秒几十太比特提升到几百太比特,可插拔光模块模式在功耗、信号完整性和前面板密度方面面临严峻挑战[6] 共封装光学器件的角色与演进 - CPO通过将光引擎放置在更靠近交换机ASIC的位置(通常在同一封装内),大幅缩短电气路径,从而降低I/O功耗、提高信号完整性并实现更高的总带宽扩展[7] - CPO使光模块解决传输距离问题,同时将电SerDes限制在其最高效的工作范围内[7] - 行业对光链路应用存在不同看法:NVIDIA在纵向扩展中坚持铜缆优先,而Marvell和Broadcom等其他厂商似乎更愿意在纵向扩展架构中引入光链路[9] - 人工智能系统架构的中短期演进是渐进式的,光器件不会立即完全取代铜线[6][11] - 长远来看,纵向与横向扩展的界限可能模糊,随着逻辑节点上加速器数量增加和系统物理尺寸增大,即使电气性能可行,铜基架构也将面临功率密度、气流和布线复杂性压力,光纤I/O可能开始在纵向扩展中发挥作用,特别是在推理优化架构中[10]
从铜到CPO:人工智能互连变了