文章核心观点 - 中国发布了首台持续性能超过2 EFlops的双精度浮点运算超级计算机“灵晟”(LineShine),该系统实现了全栈自主可控与六大技术突破,并通过“三算合一”架构统一支持科学计算、工程计算和人工智能计算,其能效比达到国际领先水平[1] 系统架构与技术规格 - “灵晟”超级计算机由20480个计算节点组成,每个节点配备两个基于ARMv9架构的LX2处理器,每个LX2处理器集成了两个计算芯片(共304个核心)和八个HBM内存栈(总容量32GB,总带宽4TB/s)[2] - 每个计算芯片包含152个核心和128GB封装外DDR内存,组织成四个NUMA域,并配有专用的SDMA引擎负责DDR和HBM间的数据传输[2] - 节点间通过凌奇高速网络互连,采用双平面多轨胖树拓扑结构,每个节点带宽为1.6 Tb/s[2] - 系统提供2 Exaflops(EFlops)的计算能力,使其成为全球最快的超级计算机之一,也是目前最快的全CPU架构超级计算机[2] 性能与算力细节 - LX2处理器支持FP64/FP32/FP16/INT8指令集,在FP64和FP32下可分别提供高达60.3 TFLOPS和120.6 TFLOPS的运算能力[2] - 该系统的理论峰值性能使其跻身世界最快超级计算机行列,作为对比,目前TOP500榜单上最快的计算机(使用AMD GPU加速的HPE Cray系统)已验证性能为1.8 EFlops,理论峰值为2.8 EFlops[2] 建设规划与基础设施 - 系统将分两期建设:第一期采用100台华为鲲鹏服务器,共计12800个核心;第二期计划部署47000个CPU,分布在92个计算机柜中[1] - 第二期配套基础设施包括:100万个端口的互连网络、36个网络机柜、67个存储机柜、428个存储节点以及10TB/s的带宽[1] - 系统上线后将拥有650PB的存储容量,但完全上线可能还需数年时间[1] 技术创新与特点 - 系统通过国产高性能CPU、片上高带宽内存与高速互连网络等核心技术创新,实现了架构、性能、能耗等六大突破[1] - 关键创新在于打破了传统超算中心科学计算、工程计算与人工智能计算“分而治之”的格局,通过自研软硬件平台实现“三算合一”,能统一高效支撑分子动力学、流体仿真与AI大模型训练等任务[1] - 系统采用了全球最大规模的集中式全液冷散热系统,实现了国际领先的能效比[1]
国产全CPU超算发布:2 Exaflops算力
半导体行业观察·2026-04-29 08:55