Anthropic发布Fable 5与Mythos 5模型 - 公司于今年4月发布了名为Claude Mythos Preview的模型,该模型被定位为超越Opus的“神话”级别模型,当时与约50家初始合作伙伴发现了超过一万个高危或严重级别的漏洞[2] - 经过两个月,公司于今日发布了Fable 5版本,该版本在底层模型基础上增加了安全分类器并向所有用户开放,同时向原有合作伙伴发布了Mythos 5版本[2] - Fable 5与Mythos 5基于同一底层模型,核心区别在于Fable 5增加了额外的安全限制层[4] 模型定价与获取策略 - Fable 5模型定价为每百万输入token 10美元,每百万输出token 50美元[8] - 从发布日到6月22日,Fable 5将免费包含在Claude Pro、Max、Team及企业版订阅方案中,6月23日起将从订阅方案中移除,未来仅能通过API使用,公司表示将在容量充足时考虑将其恢复为标准订阅组成部分[7][8] 模型性能基准测试 - 在Agentic coding SWE-Bench Pro测试中,Mythos 5/Fable 5得分80.3%,高于Mythos Preview的77.8%、Opus 4.8的69.2%、GPT 5.5的58.6%和Gemini 3.1 Pro的54.2%[15] - 在Agentic coding测试中,Mythos 5/Fable 5得分29.3%,显著高于Opus 4.8的13.4%和GPT 5.5的5.7%[15] - 在Knowledge work测试中,Mythos 5/Fable 5得分1932,高于Opus 4.8的1890和GPT 5.5的1769[15] - 在Cybersecurity ExploitBench测试中,Mythos 5/Fable 5得分78.0%,远高于Mythos Preview的69.0%、Opus 4.8的40.0%和GPT 5.5的34.0%[15] - 在Health HealthBench Professional测试中,Mythos 5/Fable 5得分66.0%,高于Mythos Preview的64.7%、Opus 4.8的56.9%和GPT 5.5的51.8%[15] 模型能力与应用案例 - 在代码开发任务中,Fable 5在30分钟内自主完成了一个涉及聚簇概念和时间衰减算法的热点排序功能开发并上线[21][22] - 在数据分析任务中,Fable 5花费1小时18分钟生成了一份极其详细的网页报告,对现有评分体系提供了深刻的洞见[31][34] - Stripe使用Fable 5在一天内完成了对其5000万行Ruby代码库的全库迁移,此项工作若由人工团队完成可能需要两个多月[45][47][50] - 在游戏领域,Fable 5仅通过视觉屏幕截图输入,无需任何代码、地图或作弊辅助,即从头到尾通关了《宝可梦火红》这款RPG游戏[53][54][55] - 在工具创造领域,Fable 5自主创建了一个基于浏览器的3D CAD编辑器,并使用该工具设计了一个可3D打印的模型[60][61] - 在生命科学领域,未受安全限制的Mythos 5将药物设计流程的某些环节加速了约十倍,并在一个蛋白质设计实验中,针对14个蛋白质靶点产出了9个有潜力的候选方案[64][66] - 在基因组学研究中,Mythos 5整合了跨138个动物物种、数百万个细胞的单细胞数据,自主设计并训练的机器学习模型在性能上超过了一个近期发表在《Science》上的模型,且模型规模小了100倍[67][68] 模型安全限制与使用成本 - Fable 5的安全限制主要针对三类领域:网络安全、生物与化学、模型蒸馏[69] - 由于安全限制,涉及药物和基因等特定科学研究只能在Mythos 5上使用,Fable 5会拒绝相关请求并可能退回至Opus 4.8模型[69] - 用户实际使用中感受到Fable 5的计算资源消耗显著更高,例如一位Claude Max会员(200美元档)运行3个任务(其中1个未完成)即消耗了约5小时额度的73%[16] 行业竞争格局与定价对比 - 与主要竞品相比,Fable 5的定价(输入$10/百万token,输出$50/百万token)高于GPT-5.5(输出$30/百万token)和Claude Opus 4.8(输出$25/百万token),远高于DeepSeek V4 Pro(输入$0.435/百万token,输出$0.87/百万token)[10] - DeepSeek V4 Pro因其极低的定价和不错的智能水平,被用户广泛用于工作流中的自动化API任务[12][13]
Claude Fable 5正式发布 - 王者归航。
数字生命卡兹克·2026-06-10 10:04