Claude 急了！模型降智，官方长文用 bug 搪塞？开发者怒怼“太晚了”：承认不达标为何不退钱？

事件概述 - Anthropic公司承认其AI模型Claude在8月至9月初出现服务质量下降，并将其归咎于三项互不关联的基础设施漏洞[4] - 公司强调模型质量下降并非由于需求、时间或服务器负载变化，纯属基础设施bug导致[4] - 事件暴露出公司在基础设施变更的审慎验证和极高执行标准方面未能落实[4] 技术故障详情 - 第一个bug是上下文窗口路由错误，8月5日出现，最初影响全部Sonnet 4请求的0.8%，8月29日负载均衡变化后影响比例升至16%[7][9] - 第二个bug是输出异常，8月25日部署的错误配置导致token生成出错，在英语提示下生成泰语或中文字符[11] - 第三个bug是近似top-k XLA:TPU编译错误，8月25日部署的代码改进触发了编译器潜在bug[13] - 路由机制具有"粘性"，导致部分用户受到更严重影响[10] 问题诊断与修复挑战 - 多项bug相互交织且症状在不同平台有区别，导致诊断异常困难[8][21] - 公司内部隐私保护措施限制工程师访问用户交互细节，增加了重现bug的难度[21] - 原有验证流程包括基准测试、安全评估和性能指标，但无法捕捉用户上报的性能下降根源[21] - 修复工作分阶段部署，第一方平台和Google Cloud Vertex AI于9月16日完成，AWS Bedrock于9月18日完成[10] 用户反馈与信任危机 - 开发者反映模型质量严重退化，体验从"可以分派任务的初级工程师"变为"和一只猴子打交道"[3] - 长期用户指出问题持续存在且情况更糟，Claude Code CLI完全无视指令[24] - 用户要求公司提供退款或免费服务作为诚意体现[25] - 尽管工程师承诺下一个版本会更好，但用户普遍持怀疑和不信任态度[25] 市场竞争与商业策略影响 - 在ChatGPT、Gemini等竞品编码能力增强的背景下，用户开始转向其他工具[24][31] - 用户批评公司压榨付费用户，认为在竞争激烈的市场中需要更多忠诚开发者拥护[29] - 公司推出Max计划并提供不同层级额度，但用户抱怨使用限制过于严格[31][32] - 团队用户反映即便小文件也会导致会话崩溃，基本功能几乎无法使用[32] 公司改进措施 - 计划建立更灵敏的评估方法，准确区分正常运行及故障实现[26] - 扩大质量评估范围，在实际生产系统上持续运行评估[26] - 提升调试工具速度，在不牺牲用户隐私前提下结合社区反馈[26]