“AI登月时刻”,OpenAI模型摘取奥数金牌
虎嗅·2025-07-20 09:41
重大意义在于,这是一个通用推理模型,而不是一个专门用来解数学题的专门系统,也没有经过验证的奖励信号,即它不是依赖于"有标准答案、实时打 分的奖励"来学会的,而是靠更通用的推理和新技术,在长时间复杂的过程中,做出了正确的推理和证明。 OpenAI证明,尽管经历了Meta疯狂的挖角,它依然保持了顶尖研究人才的密度,做出重大的研究突破。本周OpenAI的模型o3 alpha在AtCoder世界巡回赛 2025决赛中仅逊于人类编程奇才Psyho,获得第二名;测试中强于o3 pro,是最好的编程及物理模型。 这样,OpenAI目前拥有了最强的编程及数学模型,让它再次碾压DeepMind,Anthropic,Grok等,也再次与中国引领的开源模型拉开了差距。 OpenAI的一个通用推理模型,在刚结束的国际奥林匹克数学竞赛(IMO)中达到了金牌的水平。AI登月时刻,社交媒体一夜无眠,AI圈子沸腾了。 在与人类参赛者完全相同的规则下,OpenAI的模型挑战了2025年IMO试题:两场各4.5小时的考试、禁用任何工具和互联网、只能阅读官方题面并以自然 语言撰写完整证明。模型完整解出了6题中的5题。每道题都由三位前IMO奖牌得主 ...