全崩!AWS凌晨宕机,航班延误、银行瘫痪、多国陷入“数字停摆”

事件概述 - 成千上万家网站、应用程序及服务出现中断或访问延迟 [1] - 故障起始于10月20日美东时间凌晨约3:00 AM ET,AWS的US-EAST-1区域首先报告显著的错误率和延迟现象 [3] - 故障发生约三小时后,AWS表示已开始恢复,但部分用户仍存在问题 [12] 影响范围 - 受影响的服务遍布游戏、电商、金融、通讯、智能家居等多个领域 [3] - 具体受影响公司包括Snapchat、Facebook、Fortnite、Coinbase、Perplexity、达美航空、联合航空等 [5] - 故障波及超千家公司,仅在中断发生的前两个小时内,美国就提交了超过100万份问题报告,英国提交了超过40万份报告 [8] - 多家航空公司报告其app和网站受影响,乘客无法在线值机或查看预订信息,有航班降落却无法停靠 [8] - Flickr、PlayStation和Amazon等企业网站无法正常运作,显示404错误通知和致歉信息,一些银行用户被告知无法处理请求需稍后重试 [5] 故障原因与恢复 - AWS称问题源于其网络系统出现异常,从而引发连锁反应,此次故障并非黑客攻击,而是内部监控系统故障导致系统失效,影响多个服务启动与负载均衡 [11] - AWS后续表示已全面缓解底层DNS问题,大部分服务恢复正常,但仍有部分服务迟缓或功能受限 [11] - 网络安全专家表示缓慢而坎坷的恢复过程是完全正常的,工程师对云计算基础设施进行修复的过程可能会引发较小的中断 [12] 财务影响 - 互联网性能监控公司Catchpoint的首席执行官估计,AWS服务中断造成的总财务影响将达到数十亿美元 [11]