Anthropic新模型Claude Mythos意外泄露 - Anthropic意外泄露了其尚未发布的最强新AI模型Claude Mythos(内部代号Capybara),泄露原因是内容管理系统配置的“人为错误”,导致超过3000个未发布内容资源可被公众访问[2][12] - 泄露的文件显示,Claude Mythos是公司迄今为止开发的最强AI模型,将作为比现有顶级模型Claude Opus更高、更昂贵的新层级推出[4][7] - 公司已完成Claude Mythos的训练,但由于其能力强大且部署成本高昂,计划采取比以往更慢、更渐进的发布策略,先从一小部分早期访问客户开始[13][14] Claude Mythos的核心能力与潜在风险 - 与当前最强模型Claude Opus 4.6相比,Claude Mythos在软件编程、学术推理和网络安全等多项测试中取得了显著更高的分数[4] - 这三项能力的结合构成了强大的“攻击能力链”:编程能力使其能理解并生成可执行代码;推理能力可规划复杂攻击路径;网络安全能力的提升使其更擅长发现和利用漏洞[8] - 公司对模型在网络安全领域的短期潜在风险表示担忧,因此发布前希望进行全面风险评估,并帮助网络防御方提前做好准备[13] 行业背景与影响 - AI行业正跨过一个临界点,头部模型的能力已从“更会写代码”发展到能直接作用于真实系统并发现软件漏洞[17] - 此类能力是“双刃剑”,Anthropic曾披露有具备国家背景的黑客组织尝试利用其模型发起攻击,并成功渗透了约30家机构[17] - 此次泄露事件凸显,当模型能力逼近现实系统边界时,AI公司面临的挑战已不仅是技术研发,更是“能否安全地发布”[18] 其他相关信息 - 泄露文件还透露,Anthropic计划在英国举办一个为期两天的闭门活动,面向欧洲最具影响力的CEO,内容包括政策趋势分享和体验未发布的Claude功能[15] - 在泄露事件发生的同时,有消息称Anthropic正在推进IPO计划,预计最快在当年第四季度上市[18]
全网疯传!Claude最新模型意外曝光:全面碾压Opus 4.6,强到让Anthropic不敢发布
AI前线·2026-03-27 19:12