美国三AI做日本“高考真题”，谁的成绩更好？

AI模型在顶尖大学入学考试中的表现 - OpenAI的GPT 5.2 Thinking模型在东京大学和京都大学的所有科类和学科总得分中均排在首位[2] - 在两所大学的全部科目和院系，OpenAI模型在大学入学统一考试和二次考试的总得分超过了人类考生的最高分[4] - 在东大理科考试中，OpenAI得503分，谷歌得496分，均超过了最难考的东大理科三类（满分550分）的人类最高分453分[4] 各AI模型的优势科目与进步 - OpenAI在理科科目表现强劲，在东京大学和京都大学的文科数学、理科数学以及京都大学化学共计5个科目获得满分[6] - 与2025年调查相比，OpenAI在数学科目进步显著，东大理科数学得分率从不到一半提升至满分，论证过程被评价为“模范答案”[6] - OpenAI在物理和化学领域的得分率接近90%，但在国语和东大历史科目得分停滞，东大世界史得分率仅25%[6] - 谷歌在国语等文科科目得到高分，在东大世界史得分率达80%，日本史接近70%，东大文科科目合计得分超过OpenAI[7] - 谷歌在东大的所有科目中排名第一，并在2026年1月的大学统一考试调查中擅长读取地理图[4][7] - Anthropic的Claude Opus 4.5模型在东大物理科目获得满分，日本史获得第一名，并且在所有科目上均达到合格标准[4][6][7] AI行业的技术发展与竞争格局 - 此次测试对象包括OpenAI的“GPT 5.2 Thinking”、谷歌的“Gemini 3 Pro Preview”以及Anthropic的“Claude Opus 4.5”这些尖端模型[4] - AI不断改良逻辑思考机制取得成果，在按顺序进行必要计算的同时，能简洁地写下论证[6] - 根据AI学习的数据和模型特点，各模型的优势领域各不相同，AI用户需要根据业务内容来选择模型[7] - 行业观点认为，AI模型的基础聪明度已得到充分展示，未来的考验在于人类如何将自身的数据和业务与AI联系起来的设计能力[7]