Workflow
人类心智模拟
icon
搜索文档
Nature刊文称“AI可模拟人类心智”,Science同日强烈质疑
虎嗅· 2025-07-21 08:43
AI模型Centaur的研究成果 - 跨国团队推出名为"Centaur"的AI基础模型,宣称能模拟人类认知并高准确率预测人类行为[7][9] - 模型基于Meta开源大模型Llama 3.1 70B,采用量化低秩适配技术微调,仅需0.15%参数即可模拟人类行为[16] - 配套开发小型版本Minitaur,基于Llama 3.1 8B,可在Google Colab免费GPU实例运行[17] 技术实现与数据基础 - 使用Psych-101数据库,涵盖160项心理学实验、超6万名参与者、1000万次选择及2.54亿文本tokens[10][12] - 将实验数据人工转录为标准自然语言文本,使模型能像阅读故事般学习人类行为细节[14] - 模型内部表征与人类大脑神经活动存在相关性,预测fMRI数据的皮尔逊相关系数优于基础模型[33][35] 模型性能表现 - 在未训练过的"魔毯探险"等新场景中保持准确预测,证明理解任务内在结构而非表面故事[21] - 在LSAT逻辑推理、道德决策等全新领域表现优异,展现通用认知模型潜力[23][24] - 能模拟人类探索策略和学习模式,且可预测人类反应时间[26][28] 科学界争议 - Science杂志同日刊文质疑,学者指出行为匹配不等同心智模仿,模型本质仍是统计匹配机器[46][51] - 测试显示模型存在"超人"能力,如记忆256位数字、1毫秒反应时间,与人类认知局限性不符[54][55] - Psych-101数据库虽庞大,但仅覆盖人类认知的有限片段,泛化能力存疑[58] 应用价值 - 通过"科学遗憾最小化"方法优化决策模型,发现人类在权威专家意见使用上的灵活策略[43][44] - 帮助构建可解释的加权平均决策机制,新模型预测准确度接近Centaur但保持可解释性[45]