AI算力爆发式增长 数据中心面临哪些挑战?专家这样说
每日经济新闻·2025-09-18 00:12

AI算力需求与模型演进 - AI模型参数量从GPT-1的1.17亿跃升至GPT-5的数万亿级别,模型结构从稠密LLM向MoE稀疏化及多模态持续演进 [1] - AI训练与推理任务复杂度提升推动单机柜功率从当前50kW向300kW甚至更高水平跃进,单集群供电需求跃升至数百MW,远超现有数据中心单栋楼10-20MW的供电能力 [4] AI算力设施技术趋势 - AI算力设施向高密度、液冷化、集群化方向演进,单纯依靠传统服务器堆叠已无法满足需求 [1] - 风冷方案已接近极限,液冷成为数据中心冷却技术的转型方向 [5] - 单机柜功率密度快速提升,去年20kW为主流,今年华为384型机柜达60kW,互联网大厂在推理和训练场景的单柜容量将很快突破100kW [5] - 国际领先项目单机柜功率密度普遍达120至150kW,英伟达规划2028年向600kW推进,而国内主流在40-60kW/柜 [7] AIDC设计与建设挑战 - 超高密度、超大规模部署对数据中心动力适配、楼体结构、空间规划等方面提出巨大挑战 [1][4] - 机房需具备足够灵活性和弹性扩展能力,规划建设模式需具有前瞻性 [1] - 《AIDC机房参考设计白皮书》建议构建全链路高效供电体系,中低压配电系统按最大容量池化设计,机房设计需预留充足层高和承重余量 [5] 国内外AIDC发展路径对比 - 海外科技巨头持续加码AI基建,OpenAI计划投入数万亿美元,Meta将斥资数千亿美元建设大型AI数据中心 [6] - 2025年年初以来,多个国家和地区宣布千亿美元以上资金规模投向AI基建领域 [6] - 海外技术路线更注重GPU性能发挥,常配置冷机提供中温冷冻水,国内受节能降耗驱动,供水水温较高(30-40摄氏度)以实现全年自然冷却 [7] - 海外已实现10万卡集群落地,国内基于国产算力卡的超大规模集群面临组网挑战,但硅光封装、光互联等技术正在解决相关问题 [7] 产业发展与未来展望 - 未来两三年国内AIDC建设将保持每年40%以上增速,预计到2030年前后年增长率在10%左右 [5] - 全球计算联盟(GCC)已在智能计算、数据中心等领域布局重点标准,目前已发布20项,预计年底达30项 [8] - 产业界正针对AIDC面临的热、电、空间等挑战,投入新技术研发推广以提升能效和性能,并加大产业协同与生态建设 [8]