Claude强到不敢发的Mythos，被质疑用了字节Seed技术

文章核心观点 - 市场猜测Anthropic最新发布的Claude Mythos模型可能采用了字节跳动Seed团队提出的循环语言模型架构，特别是在图搜索等任务上表现出的异常优势，暗示其可能并非单纯依赖规模扩展，而是存在架构创新 [1][4][12] Mythos模型在图搜索任务上的异常表现 - 在GraphWalks BFS 256K-1M测试中，Claude Mythos得分80.0%，远超Claude Opus 4.6的38.7%和GPT-5.4的21.4%，领先优势接近4倍 [9][10][30] - 这种在特定任务上出现的巨大分差，表明其进步很可能源于架构创新，而非通用的规模扩展法则 [11][12] 循环语言模型的架构特点与优势 - 字节跳动Seed团队提出的循环语言模型能在模型内部潜空间进行迭代计算，不额外输出更多token [16][19] - 该架构允许模型根据问题难度自动调节思考步数，简单题少想几步，难题多想几步 [22] - 在预训练阶段，模型学习的是“如何在潜空间思考”，而不仅仅是“预测下一个token” [22] - 实验数据显示，1.4B参数的Ouro循环模型性能对标约4B参数的传统模型，2.8B的Ouro模型性能相当于8B–12B的传统模型，实现了小模型碾压大模型的效果 [21] 支持Mythos采用循环架构的线索 - 线索一：图搜索任务优势：Mythos在广度优先图搜索测试中表现异常突出，得分是GPT-5.4的4倍，也比上一代Opus有大幅提升 [28][29][30] - 线索二：反常的token使用与速度：Anthropic报告称Mythos每个任务使用的token数量是Opus 4.6的1/5，但生成速度反而更慢，这与标准Transformer的预期相悖，却符合循环模型在潜空间进行大量计算的特性 [30][31][32] - 线索三：网络安全能力突出：Mythos在CyberGym测试中得分83.1%，领先Opus 4.6近17个百分点，并能发现大量零日漏洞 [34][35]，漏洞发现的本质是对控制流图进行遍历，这同样是循环架构的强项 [36][37] 架构创新与规模扩展的差异 - 规模扩展法则通常带来相对均匀的能力改善，而架构创新则会在与其归纳偏置匹配的任务上创造出异常尖峰 [39] - 循环Transformer的归纳偏置是迭代图算法，而Mythos表现出的异常尖峰恰好出现在图遍历任务上，这进一步支持了其可能采用循环架构的猜测 [40]