搜索文档
数据中心智算化升级改造白皮书(2024年)
中国通信工业协会数据中心委员会· 2025-01-08 16:46
行业背景与政策 - 数据中心正从提供基础计算资源向提供智能化、一体化的 AI 算力服务方向快速演进 [5] - 政策层面推动数据中心向智能化、高效化、绿色化方向转型升级 [5] - 2023 年 10 月,工信部等 6 部门联合下发《算力基础设施高质量发展行动计划》,明确提出未来要结合人工智能产业发展和业务需求,推动算力+行业融合发展,力争 2025 年智能算力占比达到 35% [11] - 2023 年 12 月,国家发改委等 5 部门出台《深入实施"东数西算"工程加快构建全国一体化算力网的实施意见》,强调提升智能算力在人工智能等领域的适配水平 [11] - 北京、上海、深圳等重点省市以算力体系建设为抓手推动人工智能服务体系建设 [12] 行业现状与挑战 - 截至 2023 年底,我国算力总规模达到 230EFLOPS,其中智能算力规模达到 70EFLOPS [27] - 2021 年启动的"东数西算"工程涉及 8 个地区,规划了 10 个国家数据中心集群,截至 2023 年底,"东数西算"干线光缆规划已超过 180 条,骨干网互联带宽扩容到 40T [27] - 数据中心成本高,初始一次性资本支出高,大部分资金用于购置 IT 设备 [29] - 数据中心主要分为三个层级:北上广三地需求集中区、环一线城市数据中心产业带、西部算力支撑保障区 [29] - 2023 年底,全球算力总规模约达 910EFLOPS,同比增长 40%;智能算力规模达 335EFLOPS,同比增长 136% [31] - 全国数据中心总规模已超过 650 万架(折合标准机柜/2.5kW),近 5 年年均增速超过 30% [32] - 预计到 2030 年,中国数据中心用电量将达 1500 亿度,2025 年之前平均 PUE 为 1.4,2025 年开始平均 PUE 将降至 1.3 以下 [33] 技术挑战 - 智算中心单机柜功耗从传统数据中心的 4~6kW 逐渐增加至 20~40kW,未来可能达到 40~120kW 甚至更高 [36] - 智算业务的负载波动大,呈现出周期性、大幅度、并发性、瞬时冲击等特性,对配电和制冷系统提出挑战 [37][38] - 智算化改造涉及低碳高效发展,需评估周边环境与资源、建筑布局、电气链路架构设计、制冷系统设计等 [39] - 数据中心算力化改造涉及资本支出和运营支出,硬件升级和维护成本高 [40][41] - 数据中心需要频繁更新系统补丁、应对安全威胁、处理设备故障,推高了专业技术人员的依赖和人才成本 [42] 技术策略与方案 - 智算中心单机柜功耗可达百千瓦级,需优化电气和制冷系统等动力和环境保障能力 [62] - 针对不同功耗段,采用列头柜+电缆+单相 PDU、列头柜+电缆/智能母线+三相 PDU、智能母线+铜排+定制化配电模块等配电方式 [63] - 制冷系统升级改造需根据机柜功耗和冷却形式进行适配,低功率密度项目可采用风冷形式,高功率密度项目可采用液冷+风冷方案 [66][67] - 液冷技术分为冷板式液冷和浸没式液冷,适用于高功率设备的散热需求 [68] - 智算化改造需优化系统技术方案,降低能耗绝对值、提高能源利用率 [69] - 通过设备升级与更新、能源在线计量、细节质量提升等手段优化数据中心效能 [70][71][72] - 引入 AI 进行负载预测和能源精细化管理,实现快速响应和负载动态优化 [73][75][76] 测评指标体系 - 测评指标体系涵盖性能指标、经济指标、环境指标,确保评估结果全面反映智算化升级改造的成效 [82] - 性能指标包括算力效率(CE)和能源效率(PUE),CE 为数据中心每瓦功率所产生的算力,PUE 为数据中心总能耗与 IT 设备能耗的比值 [83][84] - 经济指标包括算力成本变化率(CRC)和改造总投资收益率(ROI),CRC 为改造前后算力成本的比值,ROI 为改造后年平均税前利润与改造总投资的比值 [86][87] - 环境指标包括碳排放(CM)和清洁电能比(CPR),CM 为满足数据中心业务需求所产生的碳排放,CPR 为清洁能源产生电力的使用总量与总用电量之比 [88][90]