每 20 次里有 1 次,回答你的不是那个旗舰——Claude Fable 5 的暗门,一个操作员摸完了
深思SenseAI·2026-06-10 11:25

Claude Fable 5 模型概述 - 新发布的旗舰模型Claude Fable 5对所有用户提供13天免费使用期,截至6月22日[3] - 该模型与仅限Project Glasswing合作伙伴使用的Mythos 5底层相同,区别在于安全护栏的设置,是公开版本中最强的模型[6] - 在SWE-Bench Pro基准测试中,Fable得分80.3%,显著高于Opus 4.8的69.2%和GPT 5.5的58.6%[6] 技术性能与优势 - 模型在处理长而复杂的任务时优势更明显,其领先幅度随任务复杂度增加而扩大[7] - 在视觉能力上有重大升级,能够仅凭截图重建网页应用源码,并成功通关Pokémon火红版游戏[10] - 记忆能力显著增强,在《杀戮尖塔》游戏测试中,其性能提升是Opus 4.8的3倍,长任务处理能力成为其力量倍增器[10] - 在FrontierCode基准测试中,Fable使用中等(medium)档位努力值已超过Opus 4.8使用最大(max)档位的表现[12] 使用机制与路由策略 - 模型内置分类器,当检测到用户提问涉及网络安全、生物化学或模型蒸馏(窃取能力)三类话题时,会将问题自动路由给Opus 4.8模型处理,并给出提示[9][11] - 此类路由触发概率低于5%,但用户若涉及相关领域工作,需注意实际应答模型可能已切换[9] - 这种设计应被理解为智能路由机制而非模型降级,用户可据此优化工作分配,将flagged任务直接交给Opus,其余任务充分利用免费Fable[9] 实际应用与效能验证 - 在实际代码审查测试中,Fable在熟悉的活跃项目里发现了此前Opus数月都未发现的bug,仅一个钱包解析器就找出9个问题[14] - 其优势体现在能同时处理整个文件的工作记忆,并发现隐藏在函数间接缝处的复杂bug,这体现了长上下文和视觉升级的实际价值[14] - Stripe公司使用该模型完成了对五千万行Ruby代码库的全库迁移,耗时仅一天,而人工处理预计需要两个月[7] 使用建议与经济性 - 模型定价为10美元输入、50美元输出,不到上一代Mythos Preview价格的一半[6] - 建议用户根据任务类型调整努力值(effort)档位:长任务使用xhigh,日常编辑和提问使用medium即可,max档位往往边际效益递减[12] - 在自动红队测试中,Fable在攻击性任务上的成功率仅为5.4%,显著低于Opus 4.8的56.6%和Opus 4.6的83.2%,这反映了其安全护栏的有效性[9] - 免费期结束后,Fable将从订阅服务中移除,后续使用需按API价格扣除额度,公司表示将在产能允许时考虑重新纳入订阅,但无具体时间表[16] 战略行动建议 - 建议用户在免费期内优先处理那些被长期拖延、最重大且不敢轻易动手的复杂任务,例如跨40个文件的重构、大型代码审计或迁移项目[16] - 不应将免费资源浪费在总结邮件等简单任务上,而应聚焦于只有Fable等高级模型才能高效完成的重型工作[17] - 具体操作设置为使用claude-fable-5模型,对长任务开启持久记忆功能,以最大化利用其“越跑越强”和“会读屏”的能力特性[17]

每 20 次里有 1 次,回答你的不是那个旗舰——Claude Fable 5 的暗门,一个操作员摸完了 - Reportify