文章核心观点 - 思科推出新一代G300交换机ASIC芯片,旨在通过提供高达102.4 Tb/s的聚合带宽、更高效的网络架构以及显著降低的功耗,与博通和英伟达竞争人工智能数据中心后端及前端网络市场,以解决AI计算集群的网络瓶颈问题[2][3][21] AI数据中心网络瓶颈与思科的解决方案 - 现代AI数据中心网络存在两个主要瓶颈:数据中心互连(DCI)和后端网络(连接GPU/XPU)[2] - 思科此前已通过“暗金字塔”P200路由器芯片解决数据中心互连问题[2] - 本次推出的G300 ASIC旨在解决后端网络瓶颈,提供102.4 Tb/s聚合带宽,争夺1.6 Tb/s端口市场,并与博通和英伟达竞争[2] - G300还能通过提供800 Gb/s端口来提升前端网络性能,使网络扁平化并大幅降低成本[2] G300芯片的技术定位与设计目标 - G300与G200基本性能和速度相差无几,其设计初衷是挑战InfiniBand在AI和HPC集群横向扩展网络中的地位[3] - G200自2025年5月起凭借其可扩展性和低成本优势开始崭露头角[3] - G300旨在提供一种性能提升且结构精简的以太网,实现InfiniBand的高带宽、低延迟等优势,同时保留以太网的安全性、微隔离及多厂商竞争等优点[3] - 设计目标之一是解决InfiniBand芯片来源单一给部分用户带来的顾虑[3] G300芯片的发布与配套系统 - G300与新的Nexus 9000和Cisco 8000系统、新型可插拔光模块以及网络操作系统和控制平面更新一同发布[5] - 这些更新旨在更轻松地管理使用基于G300交换机的AI系统的大规模扩展网络或更强大的前端网络[5] G300芯片的架构与制造工艺 - G300拥有512个SerDes电路模块,所有模块围绕一个数据包处理引擎封装,每个SerDes分配一个以太网MAC地址[7] - 采用“无盖”芯片设计,移除封装盖以便将散热片和液冷模块直接安装在芯片上,提升冷却效率[7] - G100采用台积电7纳米工艺,G200采用台积电5纳米工艺[7] - G300配备252 MB的SRAM缓存,推测至少是G200缓存容量的两倍[7] - 推测G300采用多芯片设计:数据包处理引擎及SRAM缓存可能采用台积电3纳米工艺,而周围的SerDes芯片可能采用基于5纳米改进的4纳米工艺[8] G300芯片的性能与缓冲技术 - 252 MB的缓冲区是所有512个SerDes共用的单一统一缓冲区,提高了运行效率,尤其在网络拥塞时可防止以太网丢包和数据包损坏[10] - 大容量缓冲区与一组片上硬件负载均衡代理结合,可监控流量、绘制流量图并优化网络中所有G300交换机的流量[10] - 该优化软件采用算法,但并非严格意义上的人工智能[10] - 与所有Silicon One芯片一样,G300完全可使用P4网络编程语言进行编程[10] G300芯片的端口配置与SerDes性能 - G300中使用的SerDes由思科设计,编码前传输速率为224 Gb/s,编码后为200 Gb/s,这是思科首款200 Gb/s SerDes[12] - 芯片支持灵活的端口配置:可创建512个200 Gb/s端口、256个400 Gb/s端口、128个800 Gb/s端口或64个1.6 Tb/s端口[12] 光模块策略与功耗优势 - G300可直接驱动线性可插拔光模块,每个端口速率可达800 Gb/s,思科也提供配套的LPO模块[13] - 思科提供自主研发的1.6 Tb/s OSFP可插拔光模块,同时也为需要更多选择的客户开发基于第三方DSP的可插拔模块[13] - 迁移到LPO光模块可大幅节省电力:光模块功耗可降低约50%,AI集群中整个交换基础设施的功耗可降低约30%[13] - 部分客户为应对2026年下半年推出的GPU/XPU需要1.6 Tb/s端口,而另一些客户则认为800 Gb/s带宽已足够并选择低功耗LPO模块[13] G300的性能提升与可靠性 - 综合所有因素并根据带宽标准化后,G300的网络利用率比G200和许多竞争对手高出33%,作业完成速度快28%[14] - 思科对光模块的测试和认证体系比业内其他公司更全面,因为AI工作负载是同步的,单个光模块故障会导致AI作业重启,必须回到检查点重新开始[14][15] G300的硬件产品形态 - 风冷设备:应用于运行NX-OS的Nexus N9364-SG3以及运行SONiC的Cisco 8133,占用3U机架空间,有64个1.6 Tb/s端口[15][17] - 液冷紧凑设备:符合开放计算项目Orv3N规范的21英寸宽设备,包括运行NX-OS的Nexus N9363-SG2或运行SONiC的Cisco 8132[17] G300带来的架构与成本优势 - 以前需要六个G200设备交叉耦合才能提供102.4 Tb/秒的聚合连接,现在只需一个G300即可[19] - 即使G300价格是G200的三到四倍,与G200相比仍物超所值[21] - 在AI出现前,新ASIC芯片成本约为旧芯片的1.5倍以提供两倍带宽,而G300带来了70%的电力效率提升,对以千兆瓦为单位购买电力的公司意义重大[21] P200产品线的完善 - 除了G300,思科本周进一步完善了P200产品线,不仅在商用级Nexus设备中提供P200芯片,还在其Nexus和白盒模块化交换机的线卡中提供该芯片[21]
自研224 Gb/s SerDes,思科这颗芯片太猛了