Workflow
统一认知理论
icon
搜索文档
这个AI精准模拟人类行为大脑状态,上Nature了
量子位· 2025-07-14 08:46
核心观点 - 德国研究团队开发出首个能跨领域精准预测人类认知的基础模型Centaur,该模型仅需传统模型Llama的0.15%参数即可模拟人类在160项心理学实验中的行为[1][3][10] - Centaur不仅能预测人类行为,还能理解人类如何学习、决策和犯错,其神经表征与真人fMRI扫描结果高度吻合[5][6][34] - 该模型在多项测试中表现优于传统认知模型和基础模型Llama,展现出强大的泛化能力和与人类神经活动的一致性[25][26][28][36] 模型开发 - 研究团队构建了史上最大规模的人类行为数据集Psych-101,涵盖160项心理学实验、60092名参与者、超1000万次选择和2亿多个文本tokens[12][13] - 数据集包含多臂老虎机、决策制定、记忆、逻辑推理等多种任务,并将实验数据转化为自然语言形式以提供统一表达格式[13][14] - 模型基于开源语言模型Llama 3.1 70B构建,采用QLoRA技术进行训练,新增参数仅占基础模型的0.15%,整个训练过程在A100 80GB GPU上耗时5天[15][16][19] 性能表现 - 在人类行为预测方面,Centaur的负对数似然值(0.44)显著优于Llama(0.58)和14种经典认知模型(平均差异0.13)[24][25][26] - 能区分人类与人工智能体行为,预测人类行为准确率达64%,而预测AI行为准确率仅35%[27] - 在反应时间预测方面,Centaur的条件R²(0.87)高于Llama(0.75)和领域特定模型(0.77)[28] - 在任务结构修改和全新领域任务测试中,Centaur均保持优异表现[29][30][31] 神经表征 - Centaur各层表征对全脑区域神经活动的皮尔逊相关系数显著高于基础模型Llama[34] - 在与奖励相关脑区和运动皮层表现尤为突出,显示出优秀的人类神经活动预测能力[36] - 在语言理解任务中,Centaur中间层表征预测效果最佳,与语言处理相关脑区表现最为稳定[38] - 尽管训练过程未明确匹配神经数据,但微调后与人类神经活动呈现出一致性[39][40]