文章核心观点 上周全球遭遇可能是历史上最大的IT故障,由CrowdStrike有缺陷的软件更新引发,导致全球众多行业受影响,凸显全球IT系统脆弱性,也引发对行业监管、企业技术依赖等问题的思考 [27][30][38] 事件概述 - 周四晚全球计算机因CrowdStrike有缺陷的软件更新出现故障,周五微软发布Azure云服务问题公告 [30][34] - 故障影响航空、广播、零售、银行等行业,如航空公司取消2500架次航班,英国广播公司Sky News未能播出 [28][50][56] - CrowdStrike回滚更新,但企业恢复在线仍需时间 [39] 涉事公司 - CrowdStrike是美国网络安全公司,为企业提供网络安全软件,其Falcon软件用于保护端点设备 [44][47] - 公司所有者是亿万富翁George Kurtz,公司价值数十亿美元,为微软提供安全支持 [66] 故障原因 - 网络安全形势不断变化,CrowdStrike需频繁更新软件,但此次更新代码有缺陷,导致Windows系统崩溃 [36][71] - 该软件需深入访问企业IT基础设施核心,出错时易导致系统瘫痪 [71] 经济影响 - 此次IT故障造成的经济损失初步估计达数十亿美元,具体损失难以精确衡量 [22][53] - 航空公司虽无需赔偿乘客,但仍需承担酒店、餐饮等额外费用,可能损失数百万美元 [13][77] - CrowdStrike股价暴跌,而微软股价未受影响,CrowdStrike可能需承担赔偿责任,后续处理可能耗时数年 [53] 应对措施与思考 - 故障引发对全球IT系统脆弱性的讨论,认为应加强更新测试,分阶段推出更新,避免一次性全球部署 [52] - 企业可能会思考技术架构搭建方式,考虑引入多个网络安全供应商,以降低对单一供应商的依赖 [60] - 企业可能会重新审视数据存储方式,考虑将部分数据保留在本地服务器,而非全部迁移至云端 [86] - 行业可能需要更多监管,打破类似垄断局面,增强国家应对此类故障的能力 [19][23] 未受影响地区 - 俄罗斯因西方制裁不使用西方公司软件,使用本土卡巴斯基等公司产品,避免了故障影响 [16] - 中国企业未使用美国网络安全公司CrowdStrike的软件,因此未受影响,凸显中美在应用、操作系统和软件方面的分歧 [80] 黑客利用情况 - 故障发生后,黑客试图冒充CrowdStrike或微软支持人员进行钓鱼攻击,诱导用户点击恶意链接窃取数据 [58]
How CrowdStrike caused a global IT meltdown and what comes next