文章核心观点 - 市场猜测Anthropic最新发布的Claude Mythos模型可能采用了字节跳动Seed团队提出的循环语言模型架构,特别是在图搜索等任务上表现出的异常优势,暗示其可能并非单纯依赖规模扩展,而是存在架构创新 [1][4][12] Mythos模型在图搜索任务上的异常表现 - 在GraphWalks BFS 256K-1M测试中,Claude Mythos得分80.0%,远超Claude Opus 4.6的38.7%和GPT-5.4的21.4%,领先优势接近4倍 [9][10][30] - 这种在特定任务上出现的巨大分差,表明其进步很可能源于架构创新,而非通用的规模扩展法则 [11][12] 循环语言模型的架构特点与优势 - 字节跳动Seed团队提出的循环语言模型能在模型内部潜空间进行迭代计算,不额外输出更多token [16][19] - 该架构允许模型根据问题难度自动调节思考步数,简单题少想几步,难题多想几步 [22] - 在预训练阶段,模型学习的是“如何在潜空间思考”,而不仅仅是“预测下一个token” [22] - 实验数据显示,1.4B参数的Ouro循环模型性能对标约4B参数的传统模型,2.8B的Ouro模型性能相当于8B–12B的传统模型,实现了小模型碾压大模型的效果 [21] 支持Mythos采用循环架构的线索 - 线索一:图搜索任务优势:Mythos在广度优先图搜索测试中表现异常突出,得分是GPT-5.4的4倍,也比上一代Opus有大幅提升 [28][29][30] - 线索二:反常的token使用与速度:Anthropic报告称Mythos每个任务使用的token数量是Opus 4.6的1/5,但生成速度反而更慢,这与标准Transformer的预期相悖,却符合循环模型在潜空间进行大量计算的特性 [30][31][32] - 线索三:网络安全能力突出:Mythos在CyberGym测试中得分83.1%,领先Opus 4.6近17个百分点,并能发现大量零日漏洞 [34][35],漏洞发现的本质是对控制流图进行遍历,这同样是循环架构的强项 [36][37] 架构创新与规模扩展的差异 - 规模扩展法则通常带来相对均匀的能力改善,而架构创新则会在与其归纳偏置匹配的任务上创造出异常尖峰 [39] - 循环Transformer的归纳偏置是迭代图算法,而Mythos表现出的异常尖峰恰好出现在图遍历任务上,这进一步支持了其可能采用循环架构的猜测 [40]
Claude强到不敢发的Mythos,被质疑用了字节Seed技术
量子位·2026-04-13 13:22