购物App
搜索文档
猛裁1.6万人后,网站再崩6小时、一周4次重大事故!官方“紧急复盘”:跟裁员无关,也不是AI写代码的锅
猿大侠· 2026-03-12 12:12
亚马逊近期系统故障与AI辅助代码事件 - 亚马逊近期系统稳定性显著下降,一周内发生4起最高级别(Sev1)事故,直接影响核心业务运行[4][5][6] - 公司内部为此紧急召开“深度复盘”会议,重点讨论故障原因,其中“AI辅助代码”被反复提及[1][4] - 最严重的一次事故导致网站和App购物功能瘫痪近6小时,大量用户无法完成结算等核心操作[7] AI辅助代码在事故中的角色与争议 - 内部文档指出,过去几个季度的事故趋势中,“GenAI工具辅助的代码变更”是因素之一[11] - AI编程工具Kiro曾导致AWS服务中断13小时,其操作是删除并重新创建了整个运行环境[9] - 公司发言人后续回应称,近期事故中仅一起与AI相关,且没有事件是AI直接编写代码导致的,试图淡化AI的直接责任[10][12] 亚马逊采取的应对措施 - 核心新规:任何AI辅助生成的代码修改,都需要更高级别工程师审批后方可上线,为AI生成代码增加了“人工安全阀”[12] - 此举旨在建立安全防护机制,因为新的生成式AI使用方式目前缺乏成熟的工程规范和安全防护[11][14] 行业对AI辅助开发风险的看法 - 风险核心在于AI会放大错误并压缩人类干预和纠正问题的时间,而非AI本身会犯错[13] - AI被比喻为“非常聪明但没有安全意识的孩子”,在AI Agent技术提升开发速度的同时,企业治理体系未能同步升级[13] - 尽管高级别人工审核可能降低效率,但在当前阶段,这被认为是防止小Bug影响大规模系统的必要安全措施[13][14] 关于事故原因的其他猜测 - 有工程师猜测,近期故障频发可能与公司大规模裁员有关,团队规模缩减导致需处理更多严重事件(Sev2)[15] - 亚马逊在过去几年进行了多轮裁员,最近一次在今年1月裁掉了约1.6万个岗位[15] - 公司官方否认裁员与系统故障有关,称系统稳定性评估属于“常规运营流程”[15]