心智理论（ToM） - 财报，业绩电话会，研报，新闻 - Reportify

心智理论（ToM）

搜索文档

ToMAP：赋予大模型「读心术」，打造更聪明的AI说服者

机器之心· 2025-06-24 22:07

大语言模型的说服能力研究 - 顶尖大模型能生成条理清晰的说服语段在Reddit等平台以假乱真但缺乏心智感知能力成为发展瓶颈 [3] - 成功说服需精准洞察对方立场和思维过程即心理学中的「心智理论」(ToM) 当前大模型在对话中缺乏心智感知导致两个缺陷：仅围绕核心论点讨论无法根据论点联系提出新角度仅重复己方观点无法因应对方态度变化调整策略 [4][6] ToMAP模型架构创新 - 引入两大心智模块：反驳预测器通过提示词激活模型预判反对观点的能力生成的反驳观点与真实被说服者语义高度相似态度预测器动态评估对方对反论点的态度倾向使用BGE-M3文本编码器与MLP分类器实现 [9] - 采用强化学习训练模型说服力得分衡量对方态度变化并引入格式奖励、重复惩罚等辅助信号优化生成质量 [11] 实验性能表现 - 基于Qwen-2 5-3B的ToMAP在CMV、Anthropic、args me数据集测试中平均说服效果达17 48 显著优于基线模型和无心智模块的RL版本超越GPT-4o与DeepSeek-R1等更大参数模型 [14] - ToMAP在10轮长对话中说服力保持稳定增长而基准模型和常规RL模型说服力随轮次增加趋于饱和或下降 [17] - 训练轨迹显示ToMAP重复度惩罚保持低位思考长度显著高于基线更倾向使用理性策略而非情绪煽动 [15][16] 技术突破与行业意义 - ToMAP首次在大模型说服任务中实现对手建模与策略灵活性通过心智模块使AI具备初步社会认知特征 [19][20] - 该框架证明小模型在适当训练和模块设计下可超越大参数模型为构建可信AI交流系统提供新思路 [14][21]

心智理论（ToM）

强化学习（RL）

反驳预测器

态度预测器

心智理论（ToM）

强化学习（RL）

反驳预测器

态度预测器