超级以太网联盟与规范发展 - 超级以太网联盟于2023年7月由AMD、Arista、博通、思科、Eviden、HPE、英特尔、Meta和微软正式成立,并迅速发展至2024年底拥有超过100家成员公司和超过1500名参与者 [2] - 联盟于2025年6月发布了1.0规范,相关产品开始陆续涌现,预计硬件将于2025年秋季上市 [2][24] - 规范的主要设计人员发布了一份24页的论文,旨在提炼完整的562页规范内容 [2] 超级以太网的设计原则 - 首要原则是与现有以太网数据中心部署保持兼容,无需拆除旧基础设施,通过支持ECMP和基本ECN等最低要求实现轻松部署和扩展 [3] - 设计支持大规模可扩展性,旨在通过无连接API灵活支持数百万个网络端点,专注于传统胖树部署 [3] - 高性能通过专为大规模部署设计的高效协议实现,例如可在纳秒级速度建立点对点可靠性上下文的无连接API [4] - 在保证互操作性的前提下,允许供应商差异化,规范提出一组实现兼容协议的选项但未强制要求,促进创新 [4] 超级以太网的网络类型与适用范围 - 超级以太网区分三种网络类型:连接GPU、CPU和加速器的本地网络(覆盖10米,亚微秒延迟)、传统数据中心前端网络以及连接计算节点的后端网络 [6][7] - 超级以太网1.0规范主要专注于后端网络,设计用于在中等长度(10-150米)链路上以高带宽(400 Gbps以上)运行 [8] - 未来版本可能会更明确地针对前端或本地网络类型 [8] 超级以太网的关键新特性 - 主要特性包括使用临时数据包传送上下文的高度可扩展无连接传输协议,以及本机支持每个数据包的多路径(数据包喷射) [12] - 支持按序和无序传送可靠和不可靠数据包,并结合可选的数据包修剪等快速丢失检测方案以实现快速恢复 [12] - 提供三种配置文件以支持不同功能集:HPC配置文件提供最丰富功能集,AI Full是AI Base的超集,AI Base旨在实现最低实现复杂度 [15] - 通过重新定义字段包含随机熵值,支持数据包喷射,将数据包均匀分布在所有交换机上以充分利用网络 [16] 超级以太网的丢包响应与链路层优化 - 定义了三种可选的快速丢失检测机制:数据包修剪、乱序计数和基于熵值的方案,以改善数据包丢失响应 [19][20] - 引入新的链路层功能,如链路级重试在链路层本地处理错误,以及基于信用的流量控制提供链路级流量控制,旨在提供几乎无损的数据包服务 [22][23] - 使用临时交付上下文设计,只需轻量级消息即可建立,确保可扩展性以支持超过一百万个端点,且开始传输不产生高延迟往返 [24] 行业竞争格局与产品进展 - 博通推出了延迟仅为250纳秒的Tomahawk超级以太网交换机,适用于AI和HPC;AMD推出了Pensando Pollara 400 Ultra以太网网卡 [25] - 庞大的xAI Colossus系统使用Nvidia Spectrum-X以太网,成功在100,000节点规模上运行单任务工作负载,而非InfiniBand [1][27] - 超级以太网可能成为InfiniBand网络的竞争对手,但目前InfiniBand仍是高度优化的系统范围网络平台,未来技术可能会融合 [27]
InfiniBand,如临大敌