Workflow
数据中心灾备
icon
搜索文档
一块电池,烧瘫韩国:数据中心失火 22 小时,647 套系统因缺失“双活”集体宕机
AI前线· 2025-10-03 13:32
事故概述 - 韩国国家信息资源院数据中心发生火灾 造成647套关键系统下线 约占全国数字化服务体系的40% [2] - 火灾持续22小时 造成96套系统直接受损 全面恢复预计需要数周时间 [2][10] - 事故导致384组锂电池被完全摧毁 周边740台计算设备受损 [4] 事故原因分析 - 火灾直接诱因是UPS电池迁移作业中一块电池冒出火花 涉事电池为LG Energy Solution产品 已使用超十年且保修期已过 [4][6] - 电池迁移操作可能存在失误 在未正确关闭电源情况下断开电缆可能引发电压尖峰导致火灾 [6] - 机房布局存在缺陷 电池与服务器距离仅约0.6米 低于美国国家消防协会建议的90厘米 且缺乏不燃性屏障 [6] 灾备系统缺陷 - 超过647个政府系统(占总数三分之一以上)集中在大田单一设施 缺乏有效的"双活"云环境部署 [6][7] - 灾备体系"只做了一半" 仅在光州和大邱布置了少量存储和备份功能 规模有限 [7] - 这是韩国首次因IT灾难启动最高级别"严重"应急机制 [8] 影响范围 - 全国范围内重要服务瘫痪 包括移动身份识别系统 邮政银行业务 银行卡支付 国家法律数据库 政府电子邮件网络及119救援系统 [7] - 截至周一中午 系统恢复率不足一成(9.6%)仅62套系统恢复 [10] - 机场旅客因数字身份证系统崩溃而滞留 市民需前往实体办公室处理紧急需求 [7][11] 行业安全警示 - 锂电池在数据中心电池市场占比预计已达38.5%(2020年仅为15%) 正成为重大安全隐患 [15] - 行业需重新审视锂电池安全挑战 建议将电池模组与服务器空间隔离 部署早期探测系统并采用专用灭火装置 [15] - 类似事故频发 包括2022年韩国SK公司C&C板桥数据中心火灾(导致3.2万台服务器瘫痪)2021年法国OVH数据中心火灾(导致360万个网站瘫痪)及阿里云新加坡数据中心火灾 [15][16][18][19]