Anthropic深夜炸场，推出新模型：5000万行代码1天搞定

模型发布与定位 - Anthropic最新推出“神话级”（Mythos-class）新模型Claude Fable 5，设计为可安全用于一般用途，付费用户已可使用[1] - 公司面向一小部分网络安全防御机构和基础设施提供商推出了Claude Mythos 5，该模型与Fable 5采用相同的底层模型，但在某些方面取消了安全防护措施[9] - 公司决定先发布Fable 5，同时继续推进更广泛的网络安全应用开发工作，未来将继续扩大Glasswing计划覆盖范围，让更多机构能够使用具备网络安全能力的Mythos版本[11][12] 性能表现与基准测试 - Fable 5的性能超越了公司以往所有公开发布的模型，在几乎所有AI性能基准测试中都处于领先水平[2] - 在软件工程、知识工作、视觉、科学研究以及许多其他领域都展现出卓越性能，任务越长、越复杂，其相对于公司其他模型的优势就越明显[2] - 在Cognition的FrontierCode评估中，Fable 5即使在中等工作量下，也在所有前沿模型中得分最高，token效率高于以往的Claude模型[5] - Fable 5是目前最先进的视觉任务模型，仅凭视觉就能通关《宝可梦：火红》，而早期的Claude机器人需要较复杂的辅助设备[5] 实际应用案例与效率提升 - 在早期测试中，Fable 5将数月的工程量压缩到了几天之内[2] - 在一个拥有5000万行代码的Ruby代码库中，Fable 5仅用一天时间就完成了整个代码库的迁移，而如果由一个团队手动完成则需要两个多月[2] - 在借助Mythos 5的情况下，公司内部的蛋白质设计专家将药物设计流程的某些环节效率提高了约十倍，在一周多的时间里，Mythos 5几乎可以完全自主开展基因组学研究[9] - 这些模型帮助网络安全防御机构保护了至关重要的软件，在生命科学研究领域提出了新的假设，加速了新疗法的研发[9] 模型能力与风险管控 - 几个月前，公司曾警告Mythos系列模型具备发现并利用关键软件漏洞的能力[7] - 公司承认发布如此强大的模型伴随着风险，如果没有安全措施，Fable 5在网络安全等领域的强大功能可能会被滥用，造成严重损害[8] - 公司在发布Fable 5时加入了安全措施，这意味着对某些主题的查询将由功能次强的模型Claude Opus 4.8进行响应[8] 行业背景与公司动态 - 近几个月来，Mythos已成为Anthropic最受关注的产品之一，尤其是在其推进IPO的背景下[11]