报告行业投资评级 - 增持(维持)[1] 报告的核心观点 - 报告聚焦于中科曙光与海光信息在超节点算力领域的战略协同,认为其“芯片设计+系统集成”的模式正推动国产智算平台从单点突破走向系统领先[5][11] - 报告详细分析了曙光推出的三款超节点与高速网络产品(scaleX640、scaleFabric、scaleX40),认为它们分别在Scale Up高密度集成、Scale Out高速互连以及产品化易部署方面实现了关键突破,有望破解高端算力部署难题并降低应用门槛[2][5][13][15][22][28] - 报告看好国产超节点产业链的发展,并基于技术协同与产品突破,给出了具体的投资建议[5][6] 根据相关目录分别进行总结 曙光&海光:超节点算力与芯片设计的战略协同 - 战略协同模式:中科曙光与海光信息在保持独立性的基础上深化协同,形成“芯片设计+系统集成”的完整技术链条,海光DCU为曙光超节点提供算力核心,其芯片级互联技术HSL与曙光scaleFabric网络实现全栈互联协同[5][11] - 中科曙光核心能力:公司以超级计算起家,是核心信息基础设施领军企业,2024年IT设备业务营收117亿元,软件开发及系统集成业务营收14亿元,在超节点领域已形成算、存、网、电、冷一体化核心能力[5][12] - 海光信息核心产品:公司是国产高端处理器龙头,采用CPU+DCU双轮驱动,CPU兼容x86并迭代至五号,DCU深算系列性能对标国际产品(如深算一号FP64算力10.1 TFLOPS,接近英伟达A100的9.7 TFLOPS),2025年推出的HSL协议带宽较32G PCIe提升8倍,时延降低约一半[5][16][17][21] 超节点方案关键参数梳理 - scaleX640(Scale Up突破):全球首个单机柜级640卡超节点,采用“一拖二”高密架构,双节点可组成1280卡计算单元,单机柜总算力超600 PFLOPS,算力密度较同类产品最大提升20倍,访存总带宽超2.3 PB/s,卡间互连总带宽超570 TB/s,大模型训推性能提升30%-40%,PUE<1.04,并通过100+项RAS设计支撑10万卡级集群扩展[5][13][22][23] - scaleFabric(Scale Out突破):曙光首款基于RDMA架构全栈自研的400G无损高速网络,填补国内空白,其自研交换芯片实现64 Tbps双向吞吐,网卡芯片端到端时延低于1微秒,交换机端到端时延低至约260纳秒,构建了从物理层到应用层的全链路超算互连方案[5][14][25][26] - scaleX40(部署创新):全球首款无线缆箱式超节点,采用正交无线缆一级互连架构,部署周期从数月压缩至数小时,系统可靠性达99.99%,专为中小规模AI训推场景打造,单节点集成40张GPU,FP8精度总算力超28 PFLOPS,可稳定支撑万亿参数大模型任务,并具备纵向Scale Up和横向Scale Out的扩展能力[2][15][28]
超节点系列报告二:海光、曙光系超节点,HSL+IB构建最全互连体系