21观公司|中科曙光高管剧透:国产网络与英伟达关键指标掰手腕

行业趋势:算力竞赛焦点转向网络互联 - 全球算力竞赛进入“万卡级”甚至“十万卡级”时代,大模型训练的效率瓶颈正从芯片算力转向网络互联 [2] - 当集群规模从千卡扩展到万卡甚至十万卡,计算节点之间的通信效率成为决定整体算力利用率的关键变量 [3] - 相比传统CPU数据中心,以GPU为中心的计算节点所需网卡数量提升了10到20倍,导致高速网络用量激增 [3] 公司产品:中科曙光发布自研高速网络 - 中科曙光发布全栈自研的400G无损高速网络产品scaleFabric,成为国内首个在高端RDMA领域实现技术突破的厂商 [2] - 产品从底层112G SerDes IP到上层管理软件均为100%自研,端到端时延低至0.9微秒,达到网卡性能上限,与英伟达CX7处于同一水平 [2][4] - 单子网互连规模达传统InfiniBand的2.33倍,理论最大支持11.4万卡集群部署 [2] - 交换机单端口带宽达800Gbps,整机交换容量可达双向64Tbps [4] 产品验证:已在真实环境中稳定运行 - 该国产网络已在国家超算互联网郑州核心节点稳定运行超10个月,支撑起3万卡规模的智算集群,并承载真实大模型训练任务 [2][7] - 在真实生产环境中以近万卡规模持续稳定运行超10个月,是比实验室测试更具说服力的验证 [7] - 硬件补齐通信性能后,应用软件对计算资源的利用率可从60%-70%提升至80%、90% [7] 竞争格局:国产网络挑战英伟达生态 - 在纸面参数上,国产高速网络首次站到与英伟达NDR同台竞技的位置 [5] - 英伟达InfiniBand的统治地位源于其从芯片到通信库的完整闭环生态,生态建设已很成熟 [8] - 中科曙光的策略是在继承InfiniBand开放性的基础上,打破其在英伟达体系内的商业绑定,以更开放的姿态进行解构 [9][10] - 公司产品对英伟达常规产品采用标准网络接口,可与不同计算芯片实现互联 [10] 市场战略:以开放生态争取客户 - 核心逻辑是以足够开放、可适配所有国产算力芯片的网络方案,争取希望摆脱单一厂商绑定的客户 [11] - 具体推进路径包括:联合国内合作伙伴建立相关标准、打造生态适配系统通过用户反馈打磨产品、联合国内科研力量完善产学研用体系 [10] - 总体思路是不搞一家独大,推动技术开放,让市场蛋糕大家共享 [14] - 产品瞄准InfiniBand技术路线的国产化替代,期待实现技术国产化替代和市场占比替代 [13] 市场前景:高速网络市场空间广阔 - 市场容量和空间十分巨大,从CPU到GPU时代,网卡端口用量增长使高速网络市场规模提升10到20倍 [13] - 当前对scaleFabric兴趣最高的客户主要有两类:科学工程计算以及人工智能训练与推理 [14] - “十五五”规划明确提出构建一体化全国算力网,政策目标正稳步推进 [14] - 未来的算力网将更贴近真实用户,提供能解决实际问题的系统而非冷冰冰的算力 [15]