全网疯传！Claude最新模型意外曝光：全面碾压Opus 4.6，强到让Anthropic不敢发布

Anthropic新模型Claude Mythos意外泄露 - Anthropic意外泄露了其尚未发布的最强新AI模型Claude Mythos（内部代号Capybara），泄露原因是内容管理系统配置的“人为错误”，导致超过3000个未发布内容资源可被公众访问[2][12] - 泄露的文件显示，Claude Mythos是公司迄今为止开发的最强AI模型，将作为比现有顶级模型Claude Opus更高、更昂贵的新层级推出[4][7] - 公司已完成Claude Mythos的训练，但由于其能力强大且部署成本高昂，计划采取比以往更慢、更渐进的发布策略，先从一小部分早期访问客户开始[13][14] Claude Mythos的核心能力与潜在风险 - 与当前最强模型Claude Opus 4.6相比，Claude Mythos在软件编程、学术推理和网络安全等多项测试中取得了显著更高的分数[4] - 这三项能力的结合构成了强大的“攻击能力链”：编程能力使其能理解并生成可执行代码；推理能力可规划复杂攻击路径；网络安全能力的提升使其更擅长发现和利用漏洞[8] - 公司对模型在网络安全领域的短期潜在风险表示担忧，因此发布前希望进行全面风险评估，并帮助网络防御方提前做好准备[13] 行业背景与影响 - AI行业正跨过一个临界点，头部模型的能力已从“更会写代码”发展到能直接作用于真实系统并发现软件漏洞[17] - 此类能力是“双刃剑”，Anthropic曾披露有具备国家背景的黑客组织尝试利用其模型发起攻击，并成功渗透了约30家机构[17] - 此次泄露事件凸显，当模型能力逼近现实系统边界时，AI公司面临的挑战已不仅是技术研发，更是“能否安全地发布”[18] 其他相关信息 - 泄露文件还透露，Anthropic计划在英国举办一个为期两天的闭门活动，面向欧洲最具影响力的CEO，内容包括政策趋势分享和体验未发布的Claude功能[15] - 在泄露事件发生的同时，有消息称Anthropic正在推进IPO计划，预计最快在当年第四季度上市[18]