Workflow
考东大Open AI和DeepSeek谁得分高?
日经中文网·2025-04-07 11:36

中美AI模型在东京大学入学考试中的表现 - 美国OpenAI的"o1"和中国DeepSeek的"R1"在2025年度东京大学理科3类入学考试中均超过最低合格线368 7分,其中"o1"得374分,"R1"得369分 [1][2] - 这是AI首次在预备学校讲师的评分中获得合格判定,尽管东京大学理科3类考试包含面试环节 [2] - 在文科和其他理科科类中,两模型同样获得合格成绩,但"R1"在理科1类和2类的共通考试中未达合格线 [2] 各科目得分情况 - 英语科目表现突出:"o1"和"R1"得分率均超75%,单词和语法错误极少,远超考生平均水平 [2] - 数学科目存在明显短板:理科数学满分120分下,"o1"仅得38分,"R1"得49分,论证错误频发且说明不足 [2] 测试方法与参与机构 - 测试由日本经济新闻联合LifePrompt输出答案,河合塾讲师评分,采用东京大学2025年度真题 [1] - 参与评分的河合塾讲师指出数学成绩"明显低于合格者平均分",印证AI在复杂逻辑推理上的局限性 [2]