最新研究:AI情商测试完胜人类,准确率高出25%
36氪·2025-05-29 16:23
伯尔尼大学与日内瓦大学的最新研究表明,这些强大的人工智能系统或许确实具备这种能力,甚至可能 超越大多数人类。 01.人类情绪测试 近期发表于《通讯心理学》的研究中,研究人员评估了六种最先进的语言模型:ChatGPT-4、ChatGPT- o1、Claude 3.5 Haiku、Copilot 365、Gemini 1.5 Flash和DeepSeek V3。这些AI系统经过了五项通常用于 心理学和工作场所评估的测试,以测试情商(EI)。 这些测试包含复杂的现实场景。例如:同事窃取Michael的创意并获得不当赞誉,此时最明智的应对方 式是? 心理学家的标准答案是"向上级反映",这是一种健康、建设性的方式来处理工作中的情绪紧张。 大语言模型能写诗、解复杂数学题,甚至辅助疾病诊断,但它们真的能理解情绪吗? AI们表现出色。在五项测试中,其平均准确率达81%,远高于人类参与者56%的平均水平。 伯尔尼大学首席心理学家Katja Schlegel解释道,"我们选取了科研与企业环境中通用的五项测试,这些 测试通过情绪化场景来评估理解、调节及管理情绪的能力。" 日内瓦大学瑞士情感科学中心高级科学家Marcello Mor ...