结构化自我批判

搜索文档
强迫模型自我争论,递归思考版CoT热度飙升!网友:这不就是大多数推理模型的套路吗?
机器之心· 2025-05-12 12:31
核心观点 - CoRT(Chain-of-Recursive-Thoughts)是一种在CoT(Chain-of-thought)基础上加入递归思考的新方法,旨在提升语言模型的推理能力 [2][3] - CoRT通过结构化自我批判和递归思考模式,让AI模型生成替代方案并选择最佳响应,类似于人类的反思性思维 [4][5][6] - 尽管CoRT在GitHub上两周内获得近2k星标,但部分观点认为其原理并非创新,类似方法已在2023年论文或现有模型(如Gemini 2 5 Pro、Qwen)中应用 [7][8][9] 技术原理 - CoRT工作流程包括自我评估、生成竞争性替代方案、迭代优化和动态思维深度四个步骤 [10] - 具体实现中,AI首先生成初始响应,决定思考轮次,每轮生成3个替代响应并评估选择最优解,最终输出最佳结果 [10] 实际效果 - 在Mistral 3 1 24B模型测试中,CoRT使编程任务表现从"一般般"提升至"极佳",例如井字棋游戏代码从CLI升级为OOP实现 [11][12] - 项目仍处早期开发阶段,需通过脚本或Shell配置运行,依赖项安装后即可使用 [11]