云服务故障引发全球混乱亚马逊：基本得到控制，接近解决

事件概述 - 亚马逊公司云计算部门在弗吉尼亚州北部的数据中心发生大规模网络中断，影响已基本得到控制 [1] - 此次故障导致全球数千个网站和热门应用如Snapchat、Reddit等陷入混乱 [1] - 这是自去年CrowdStrike系统故障后全球最大的一次网络中断事件 [1] 影响范围与现状 - 故障导致从伦敦到东京的上班族被迫离线，部分用户反映数字钱包Venmo和视频会议网站Zoom等服务仍存在使用障碍 [1] - 经过数小时中断后，许多应用程序在美国当地时间下午逐渐恢复运行，但异常增高的错误率仍在影响多项服务 [2] - 亚马逊公司表示已找到问题根源并接近彻底解决，相关问题已得到“完全缓解” [1] 故障原因与历史 - 故障源于域名系统(DNS)问题，导致应用程序无法找到AWS云数据库服务DynamoDB API的正确地址 [2] - 此次事故是过去五年中第三次由亚马逊云服务(AWS)位于弗吉尼亚州北部的数据中心集群US-EAST-1引发的大规模网络瘫痪 [1] - 亚马逊公司未回应关于该特定数据中心屡次受影响原因的进一步询问 [1]