Workflow
Anthropic承认模型降智后仍放任其偷懒?Claude Code用户信任崩塌中
机器之心·2025-09-03 16:33

大模型降智现象 - 用户和媒体频繁报告大模型能力下降现象 包括OpenAI GPT-5测试中表现不及预期以及Anthropic Claude Opus系列的质量问题 [1][3] - Anthropic罕见公开承认Claude Opus 4.1在2025年8月25日17:30 UTC至8月28日02:00 UTC期间出现质量退化 影响部分请求 表现为智能水平降低 回答格式错误和工具调用异常 [5][6] - 问题源于推理堆栈更新 公司已对Claude Opus 4.1回滚更新 同时发现Claude Opus 4.0也受相同问题影响 正在回滚处理 [6] 用户反馈与市场影响 - 尽管Anthropic声称事件已解决 但截至9月1日用户对Claude Code的负面反馈持续增加 许多用户报告模型持续"偷懒"和性能低下 [7][10][12] - 用户转向GPT-5现象显著 开发者私下更偏好使用GPT-5编写代码 认为其性价比高 每月20美元费用物有所值 [8][9][13] - 具体性能投诉包括:Sonnet 4此前能直接构建项目 而Opus 4.1连简单脚本都无法生成 性能表现与使用时间相关 凌晨顺畅而白天高峰期限流后糟糕 [12][13] 行业技术动态 - 大模型供应商首次正面承认降智问题 打破此前从未公开承认的行业惯例 [3] - 研究者推测性能问题可能源于Anthropic正在研发新模型 或与推理系统更新有关 [9][13] - Cursor Agent CLI与GPT-5组合表现受到开发者认可 尤其在精心设计的提示词下效果显著 [9]