国产全CPU超算发布：2 Exaflops算力

文章核心观点 - 中国发布了首台持续性能超过2 EFlops的双精度浮点运算超级计算机“灵晟”（LineShine），该系统实现了全栈自主可控与六大技术突破，并通过“三算合一”架构统一支持科学计算、工程计算和人工智能计算，其能效比达到国际领先水平[1] 系统架构与技术规格 - “灵晟”超级计算机由20480个计算节点组成，每个节点配备两个基于ARMv9架构的LX2处理器，每个LX2处理器集成了两个计算芯片（共304个核心）和八个HBM内存栈（总容量32GB，总带宽4TB/s）[2] - 每个计算芯片包含152个核心和128GB封装外DDR内存，组织成四个NUMA域，并配有专用的SDMA引擎负责DDR和HBM间的数据传输[2] - 节点间通过凌奇高速网络互连，采用双平面多轨胖树拓扑结构，每个节点带宽为1.6 Tb/s[2] - 系统提供2 Exaflops（EFlops）的计算能力，使其成为全球最快的超级计算机之一，也是目前最快的全CPU架构超级计算机[2] 性能与算力细节 - LX2处理器支持FP64/FP32/FP16/INT8指令集，在FP64和FP32下可分别提供高达60.3 TFLOPS和120.6 TFLOPS的运算能力[2] - 该系统的理论峰值性能使其跻身世界最快超级计算机行列，作为对比，目前TOP500榜单上最快的计算机（使用AMD GPU加速的HPE Cray系统）已验证性能为1.8 EFlops，理论峰值为2.8 EFlops[2] 建设规划与基础设施 - 系统将分两期建设：第一期采用100台华为鲲鹏服务器，共计12800个核心；第二期计划部署47000个CPU，分布在92个计算机柜中[1] - 第二期配套基础设施包括：100万个端口的互连网络、36个网络机柜、67个存储机柜、428个存储节点以及10TB/s的带宽[1] - 系统上线后将拥有650PB的存储容量，但完全上线可能还需数年时间[1] 技术创新与特点 - 系统通过国产高性能CPU、片上高带宽内存与高速互连网络等核心技术创新，实现了架构、性能、能耗等六大突破[1] - 关键创新在于打破了传统超算中心科学计算、工程计算与人工智能计算“分而治之”的格局，通过自研软硬件平台实现“三算合一”，能统一高效支撑分子动力学、流体仿真与AI大模型训练等任务[1] - 系统采用了全球最大规模的集中式全液冷散热系统，实现了国际领先的能效比[1]