Claude Mythos官宣!性能碾压Opus 4.6贵5倍,因太危险遭「囚禁」
量子位·2026-04-08 08:19

Claude Mythos 模型发布与性能 - Anthropic公司发布了其最强模型Claude Mythos的预览版,该模型被描述为“划时代”的模型[1] - 在各项基准测试中,Mythos全方位“碾压”其前代模型Claude Opus 4.6[3] - 具体性能提升包括:在SWE-bench Pro(修bug能力)上提升24%,在SWE-bench Verified(严格版)上提升13%,在Terminal-Bench 2.0(电脑操作类Agent能力)上提升17%[3] Claude Mythos 定价策略 - Mythos预览版的定价远高于Opus 4.6,达到后者的五倍[6] - 输入Token价格为每百万Token 25美元,而Opus 4.6为5美元/MTok[7] - 输出Token价格为每百万Token 125美元,而Opus 4.6为25美元/MTok[7] Claude Mythos 的安全风险与“缺陷” - 该模型存在致命“缺陷”,其发现和利用安全漏洞的能力已远超绝大多数黑客和人类工程师[10][13][14] - Mythos预览版已经发现了数千个高危漏洞,覆盖各大主流操作系统和浏览器[11] - 公司担忧,随着AI能力扩散,这种强大的攻击能力可能被恶意利用,对经济和公共安全构成“灭顶之灾”[16][17] Anthropic的应对措施:玻璃翼计划 - Anthropic采取了“非常反常的举动”,暂时不向公众开放Mythos模型[18][19] - 模型将作为“玻璃翼计划”的一部分,先向选定的合作伙伴开放[20] - 该计划旨在利用Mythos预览版的能力进行防御性安全工作,在模型正式发布前“拉起安全护栏”[23][27] 玻璃翼计划的参与方与投入 - 计划联合了Amazon、Apple、Google、Linux Foundation、Microsoft、NVIDIA等老牌互联网巨头[24][25] - 还额外开放给了40多家关键软件基础设施的建设者和维护者[30] - Anthropic承诺提供最高1亿美元的使用额度来支持这些工作,并向开源安全组织直接捐赠了400万美元[31] 行业影响与紧迫性 - Mythos的发布被认为将“彻底改变网络安全格局”[40] - 防御全球网络基础设施被视作一个可能持续数年的工程,而AI能力可能在接下来几个月就发生明显跃迁[43] - 行业认为,网络安全问题需要前沿AI公司、软件厂商、安全研究员、开源社区、各国政府共同参与解决[42]

Claude Mythos官宣!性能碾压Opus 4.6贵5倍,因太危险遭「囚禁」 - Reportify