A Meta outage hit Facebook, Instagram, WhatsApp and more—here's what we know so far

文章核心观点 Meta旗下包括Facebook、Instagram和WhatsApp等在内的社交媒体和通讯服务出现重大故障,虽多数服务已恢复,但故障原因待明确,此次故障提醒需优化关键系统以提高可靠性 [1][3][13] 故障范围 - 故障影响全球用户,涉及Meta几乎所有产品,包括Messenger、Threads等,以及Facebook Ads Manager等业务产品 [1][2] - 故障从英国、加拿大、美国等地均有报告,美国于周三(纽约时间下午12:30)首次报告 [3] 故障解决进度 - 五小时后Meta发布消息称已完成99%的故障解决工作 [4] 故障可能原因 - 目前无官方说明,从故障范围看可能是单点故障,即所有服务依赖的某个环节出现问题 [5][7] - 故障广泛或表明问题出在Meta系统中未复制的部分,但需等Meta公布原因才能确定 [10] 系统可靠性设计 - 主要通过复制实现可靠性,如Instagram内容存储在内容交付网络(CDN)的大量计算机中 [8] - 内容交付网络可在某台计算机出现问题时让其他计算机接管,还能在网站需求大时分散请求,提高效率 [9][10] 经验教训 - 今年早些时候CrowdStrike的Falcon安全软件故障带来的教训是应采用故障隔离,使系统各组件独立,避免单点故障影响整个系统 [11][12] - Meta此次故障提醒需优化关键系统,减少中心点故障,采用故障隔离等工程原则 [13] 未来展望 - Meta故障确切原因待确定,全球很多人依赖Meta服务,希望Meta公布原因并采取措施防止类似情况再次发生 [14][15]