21观公司｜中科曙光高管剧透：国产网络与英伟达关键指标掰手腕

行业趋势：算力竞赛焦点转向网络互联 - 全球算力竞赛进入“万卡级”甚至“十万卡级”时代，大模型训练的效率瓶颈正从芯片算力转向网络互联 [2] - 当集群规模从千卡扩展到万卡甚至十万卡，计算节点之间的通信效率成为决定整体算力利用率的关键变量 [3] - 相比传统CPU数据中心，以GPU为中心的计算节点所需网卡数量提升了10到20倍，导致高速网络用量激增 [3] 公司产品：中科曙光发布自研高速网络 - 中科曙光发布全栈自研的400G无损高速网络产品scaleFabric，成为国内首个在高端RDMA领域实现技术突破的厂商 [2] - 产品从底层112G SerDes IP到上层管理软件均为100%自研，端到端时延低至0.9微秒，达到网卡性能上限，与英伟达CX7处于同一水平 [2][4] - 单子网互连规模达传统InfiniBand的2.33倍，理论最大支持11.4万卡集群部署 [2] - 交换机单端口带宽达800Gbps，整机交换容量可达双向64Tbps [4] 产品验证：已在真实环境中稳定运行 - 该国产网络已在国家超算互联网郑州核心节点稳定运行超10个月，支撑起3万卡规模的智算集群，并承载真实大模型训练任务 [2][7] - 在真实生产环境中以近万卡规模持续稳定运行超10个月，是比实验室测试更具说服力的验证 [7] - 硬件补齐通信性能后，应用软件对计算资源的利用率可从60%-70%提升至80%、90% [7] 竞争格局：国产网络挑战英伟达生态 - 在纸面参数上，国产高速网络首次站到与英伟达NDR同台竞技的位置 [5] - 英伟达InfiniBand的统治地位源于其从芯片到通信库的完整闭环生态，生态建设已很成熟 [8] - 中科曙光的策略是在继承InfiniBand开放性的基础上，打破其在英伟达体系内的商业绑定，以更开放的姿态进行解构 [9][10] - 公司产品对英伟达常规产品采用标准网络接口，可与不同计算芯片实现互联 [10] 市场战略：以开放生态争取客户 - 核心逻辑是以足够开放、可适配所有国产算力芯片的网络方案，争取希望摆脱单一厂商绑定的客户 [11] - 具体推进路径包括：联合国内合作伙伴建立相关标准、打造生态适配系统通过用户反馈打磨产品、联合国内科研力量完善产学研用体系 [10] - 总体思路是不搞一家独大，推动技术开放，让市场蛋糕大家共享 [14] - 产品瞄准InfiniBand技术路线的国产化替代，期待实现技术国产化替代和市场占比替代 [13] 市场前景：高速网络市场空间广阔 - 市场容量和空间十分巨大，从CPU到GPU时代，网卡端口用量增长使高速网络市场规模提升10到20倍 [13] - 当前对scaleFabric兴趣最高的客户主要有两类：科学工程计算以及人工智能训练与推理 [14] - “十五五”规划明确提出构建一体化全国算力网，政策目标正稳步推进 [14] - 未来的算力网将更贴近真实用户，提供能解决实际问题的系统而非冷冰冰的算力 [15]