Workflow
Vision Transformer
icon
搜索文档
哈佛新论文揭示 Transformer 模型与人脑“同步纠结”全过程,AI也会犹豫、反悔?
36氪· 2025-05-12 08:22
Transformer模型与人类认知处理相关性研究 核心观点 - Transformer模型的内部处理动态与人类大脑实时认知过程存在显著相似性,不仅体现在最终输出结果,更体现在中间层的"思考路径"上 [1][4][24] - 研究通过量化模型各层处理指标(不确定性、信心值、修正行为等),首次系统性验证了AI与人类在认知纠偏机制上的同步性 [7][10][17] 实验设计方法论 - 采用多模态任务测试:包括首都回忆题(自由回答)、动物分类(鼠标轨迹追踪)、三段论逻辑推理、分布外图像识别等 [9] - 关键指标: - 处理负载(Processing Load):通过模型各层输出的熵值变化量化认知难度 [10] - 信心轨迹(Confidence Trajectory):记录模型对正确/错误选项的概率波动 [10][13] - 修正行为(Boosting):测量模型在后层对初始错误倾向的主动纠正幅度 [10][19] 关键发现 认知偏差同步性 - 首都回忆任务中,Llama-2 7B模型在中间层将最高概率分配给错误答案(如芝加哥而非斯普林菲尔德),与人类常见错误完全一致 [13][15] - 澳大利亚首都测试中,模型与人类均出现悉尼→堪培拉的修正过程,错误率偏差不超过15% [13] 决策路径重合度 - 动物分类任务中,模型前几层对"鲸鱼是鱼"的错误判断与人类鼠标移动轨迹呈现相同犹豫模式,修正时间差<300ms [18][19] - 视觉Transformer处理模糊图像时,初期层级信心分散度达人类反应时间的1.2倍,后期聚焦速度与人类认知提速曲线吻合 [23] 逻辑陷阱敏感性 - 三段论推理中,当题目包含常识干扰(如"有翅膀→能飞"),模型与人类在中间层错误率同步上升47%,需额外3-5层处理才能纠正 [21] 行业应用启示 - 过程可解释性:模型内部动态可映射人类认知瓶颈,为教育/心理实验设计提供量化工具 [24] - 架构优化方向:中间层处理指标可成为评估模型认知效率的新标准,替代单一准确率指标 [7][24] - 多模态协同:鼠标轨迹等行为数据与模型信心变化的关联性达0.82,预示新型人机交互监测方式 [18][23]