Workflow
无限深度推理
icon
搜索文档
首篇潜空间推理综述!模型思考不必依赖Token,带宽暴增2700+倍
量子位· 2025-07-16 09:49
作者表示,这一框架还将有助于未来的路线探索,例如研究通过扩散模型进行无限深度推理等高级范式。 这篇综述共同一作有四人,其中字节SEED实习生、加州大学圣克鲁兹分校博士生 Ruijie Zhu 同时是通讯作者。 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 大模型在潜空间中推理, 带宽能达到普通 (显式) 思维链 (CoT) 的2700多倍 ? 史上首篇潜空间推理综述,对这种新兴的推理范式进行了全面总结。 这篇综述当中,作者分析了循环、递归、连续思维等潜空间推理的形式,并将这些方法总结成了一个框架。 这个统一框架不是强行整合,而是 建立在机械可解释性的基础之上,能够与模型的内部运作进行联系 。 什么是潜空间推理? 潜空间推理是一个新兴领域,其思想最早可以追溯到ICLR 2019上阿姆斯特丹大学学者 Mostafa Dehghani 与谷歌大脑和DeepMind (后两 者当时处于独立状态) 共同发表的 《Universal Transformers》 。 这篇文章引入了自适应计算时间(ACT)机制,首次实现了层级间的动态递归,为后续的潜空间推理研究奠定了基础。 | Mostafa Dehghani*† ...