Workflow
LEMMA
icon
搜索文档
大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%
量子位· 2025-06-18 08:54
作者通过深入分析模型犯下的错误,构建了"错误-纠正"数据集,并利用反思机制,引导模型从错误的思路平滑过渡到正确的答案。 LEMMA项目组 投稿 量子位 | 公众号 QbitAI 大模型学习不仅要正确知识, 还需要一个"错题本" ? 上海AI Lab提出了一种新的学习方式, 构建了"错误-反思-修正"数据 ,让大模型仿照人类的学习模式,从错误中学习、反思。 结果,在Llama3-8B上,数学题的解题 准确率平均提升了13.3% 。 这种方法名为 LEMMA (Learning from Errors for Mathematical Advancement) ,专门教大模型如何从错误中学习。 结果,模型不仅获得了准确率的提升,还获得了超强的自主纠错能力和泛化能力。 相关论文已发表于ACL'25 Findings。 作者首先系统分析了当前主流大模型在数学题中常见的七大类错误 (如题意误解、公式混淆、计算失误等) ,发现这些错误在不同模型之间 分布非常一致。 结果显示,大模型犯下最多的错误是误解题意,占比超过40%,随后的两张常见错误类型是公式混淆和计算错误。 | Error Type | Definition | ...