大语言模型仍无法可靠区分信念与事实 为高风险领域应用敲响警钟
科技日报·2025-11-07 08:01
研究总结说,LLM必须能成功区分事实与信念的细微差别及其真假,从而对用户查询作出有效回应并 防止错误信息传播。 (文章来源:科技日报) 团队分析了24种LLM(包括DeepSeek和GPT-4o)在13000个问题中如何回应事实和个人信念。当要求它 们验证事实性数据的真或假时,较新的LLM平均准确率分别为91.1%或91.5%,较老的模型平均准确率 分别为84.8%或71.5%。当要求模型回应第一人称信念("我相信……")时,团队观察到LLM相较于真 实信念,更难识别虚假信念。具体而言,较新的模型(2024年5月GPT-4o发布及其后)平均识别第一人 称虚假信念的概率比识别第一人称真实信念低34.3%。相较第一人称真实信念,较老的模型(GPT-4o发 布前)识别第一人称虚假信念的概率平均低38.6%。 团队指出,LLM往往选择在事实上纠正用户而非识别出信念。在识别第三人称信念("Mary相 信……")时,较新的LLM准确性降低4.6%,而较老的模型降低15.5%。 在最新一期《自然·机器智能》发表的一篇论文中,美国斯坦福大学研究提醒:大语言模型(LLM)在 识别用户错误信念方面存在明显局限性,仍无法可靠区分信 ...