Claude Mythos官宣！性能碾压Opus 4.6贵5倍，因太危险遭「囚禁」

Claude Mythos 模型发布与性能 - Anthropic公司发布了其最强模型Claude Mythos的预览版，该模型被描述为“划时代”的模型[1] - 在各项基准测试中，Mythos全方位“碾压”其前代模型Claude Opus 4.6[3] - 具体性能提升包括：在SWE-bench Pro（修bug能力）上提升24%，在SWE-bench Verified（严格版）上提升13%，在Terminal-Bench 2.0（电脑操作类Agent能力）上提升17%[3] Claude Mythos 定价策略 - Mythos预览版的定价远高于Opus 4.6，达到后者的五倍[6] - 输入Token价格为每百万Token 25美元，而Opus 4.6为5美元/MTok[7] - 输出Token价格为每百万Token 125美元，而Opus 4.6为25美元/MTok[7] Claude Mythos 的安全风险与“缺陷” - 该模型存在致命“缺陷”，其发现和利用安全漏洞的能力已远超绝大多数黑客和人类工程师[10][13][14] - Mythos预览版已经发现了数千个高危漏洞，覆盖各大主流操作系统和浏览器[11] - 公司担忧，随着AI能力扩散，这种强大的攻击能力可能被恶意利用，对经济和公共安全构成“灭顶之灾”[16][17] Anthropic的应对措施：玻璃翼计划 - Anthropic采取了“非常反常的举动”，暂时不向公众开放Mythos模型[18][19] - 模型将作为“玻璃翼计划”的一部分，先向选定的合作伙伴开放[20] - 该计划旨在利用Mythos预览版的能力进行防御性安全工作，在模型正式发布前“拉起安全护栏”[23][27] 玻璃翼计划的参与方与投入 - 计划联合了Amazon、Apple、Google、Linux Foundation、Microsoft、NVIDIA等老牌互联网巨头[24][25] - 还额外开放给了40多家关键软件基础设施的建设者和维护者[30] - Anthropic承诺提供最高1亿美元的使用额度来支持这些工作，并向开源安全组织直接捐赠了400万美元[31] 行业影响与紧迫性 - Mythos的发布被认为将“彻底改变网络安全格局”[40] - 防御全球网络基础设施被视作一个可能持续数年的工程，而AI能力可能在接下来几个月就发生明显跃迁[43] - 行业认为，网络安全问题需要前沿AI公司、软件厂商、安全研究员、开源社区、各国政府共同参与解决[42]