Workflow
行为复用(Metacognitive Reuse)
icon
搜索文档
Meta AI推理新论文:模型记住套路,推理token砍半
36氪· 2025-10-14 20:58
论文提出一个新机制,让大语言模型(LLM)能在每次推理后,总结自己重复用到的步骤,并把它们存为简短指令,称为"行为(Behavior)"。 Meta 又一次在 AI 推理上"开了挂"。 一份新论文显示,Meta 的研究团队找到一种让大模型"用更少思维,想得更清楚"的办法。 这篇论文名为《Metacognitive Reuse: Turning Recurring LLM Reasoning Into Concise Behaviors》,发表于 2025 年 9 月 17 日,来自 Meta 团队与普林斯 顿大学、蒙特利尔大学联合研究。 作者包括 Aniket Didolkar、Nicolas Ballas、Anirudh Goyal 与 Sanjeev Arora。 论文地址: https://arxiv.org/abs/2509.13237 下一次遇到类似问题,模型不再重复推,而是直接调用这些"行为"。 效果惊人。 在数学推理任务上,Meta 团队实测:模型在准确率不下降的前提下,推理所需的 token 数量最多减少 46%。 也就是说,同样一道题,模型少想一半,却答得一样准。 研究团队称,这让模型"学会 ...