文章核心观点 - AI在顶级编程竞赛中首次超越顶尖人类团队,OpenAI在ICPC 2025世界总决赛中5小时内解决全部12个问题,排名相当于人类第1位,超过了所有参赛大学团队[1] - Google Gemini同样达到金牌水平,解决了12个问题中的10个,总用时677分钟,相当于人类排名第2位[3] - 此次突破标志着AI在复杂逻辑推理、多步骤问题解决能力方面取得重大进展,正从信息处理工具转变为解决复杂推理问题的关键力量[46] OpenAI参赛表现 - OpenAI在5小时时限内解决了全部12个问题,相当于人类排名第1位[1] - AI系统对11个问题的首次提交便获得正确答案,难度最高的问题经过9次尝试后成功攻克[10] - 解题速度最快的人类选手耗时270分钟,而OpenAI在竞赛总时长300分钟内完成所有题目[11] - 参赛AI由"通用推理模型集成体"构成,结合了GPT-5与实验性推理模型,未针对ICPC进行专门优化训练[15] Google Gemini参赛表现 - Gemini 2.5 Deep Think高级版本解决了12个问题中的10个,总用时677分钟,达到金牌级别[26][28] - 若与大学队伍比较,Gemini将排名第2,仅次于OpenAI[3] - Gemini在45分钟内解决了8个问题,随后三小时内又解决2个问题[29] - 值得一提的是,Gemini在半小时内成功解决了C题,而这道题在竞赛中没有任何大学队伍解出[33] 人类团队表现对比 - 人类团队中,俄罗斯圣彼得堡国立大学排名第1,解决了11个问题[4] - 北京交通大学排名第3,解决了10个问题,总用时1425分钟[5] - 清华大学排名第4,北京大学排名第5,中国科学技术大学排名第9[4] - 在139支参赛队伍中,只有前四支队伍获得了金牌[6] 技术突破意义 - ICPC是全球公认历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,比IMO等高中奥林匹克竞赛更高一级[5] - AI在理解复杂问题、制定多步骤逻辑计划并精准执行方面展现出核心能力,这些正是许多科学和工程领域所需的关键技能[46] - 同一组模型已在国际数学奥林匹克和国际信息学奥林匹克等竞赛中证明实力,显示出强大的通用性与广泛适用潜力[15] 核心团队成员 - OpenAI参赛项目由Borys Minaiev和Mostafa Rohaninejad领导,Borys是前ICPC世界冠军,专注于大规模推理模型开发[16][19][23] - Google Gemini项目由Hanzhao (Maggie) Lin领导技术方向,与Heng-Tze Cheng共同领导整体研究和执行工作[38][39][43]
刚刚,OpenAI在ICPC 2025编程赛上满分登顶,Gemini也达到金牌水平