Workflow
长思维链里的推理步骤,哪些最关键?三招锁定LLM的「命门句子」
机器之心·2025-07-09 08:50

核心观点 - 研究提出通过分析句子层面的"思维锚"来理解LLM推理机制,三种互补方法(黑盒/白盒/因果归因)可识别对后续推理有重大影响的关键步骤[4][6][9][10][11] - 规划生成和不确定性管理类句子的重要性显著高于事实检索类句子,这类高层组织性句子能锚定推理轨迹[23][25] - 开源工具实现可视化分析,为调试推理失败和提升模型可靠性提供新路径[14][15] 方法论 黑盒反事实分析 - 通过替换句子并比较答案分布差异(KL散度)量化句子重要性,采样100次轨迹并过滤语义相似替代句[21][22] - 相比强制回答方法,避免因关键句子出现较晚导致的评估偏差[18][20] 白盒注意力模式 - 计算注意力头峰度值,发现特定头会集中关注关键句子(如规划生成类)[24] - 接收头分析显示高关注度句子与重采样重要性结果高度一致[25] 因果归因 - 抑制特定句子注意力后测量后续token logits变化,分离句子间直接影响[31] - 与重采样法显著正相关(20条轨迹中19条验证),尤其在5句间隔内相关性更强[32] 案例验证 十六进制转换问题 - 重采样法捕捉到第13句从错误"20比特"转向正确"19比特"的关键转折[36][37] - 接收头将推理轨迹划分为计算模块(十六进制→十进制→二进制)和验证回路[39][40] - 注意力抑制矩阵定位矛盾解决路径(如12→66句的错误根源解释)[41][42]