全球首个IMO金牌AI诞生！谷歌Gemini碾碎奥数神话，拿下35分震惊裁判

谷歌DeepMind在IMO竞赛中的突破 - 谷歌DeepMind的Gemini Deep Think模型在IMO竞赛中破解5道题，获得35分（满分42分），达到金牌标准[3][4][21] - 该模型在4.5小时内完成解题，使用纯自然语言（英语）进行端到端推理，无需形式语言翻译[5][25] - 这是首个获得IMO组委会官方认证的金牌级别AI系统[6][7] IMO竞赛背景与AI参与情况 - IMO是数学界最高级别竞赛，每年吸引全球顶尖学生参与，需在4.5小时内解决6道深度数学问题[10][11] - 只有前8%的选手能获得金牌[12] - 2024年AlphaProof和AlphaGeometry 2破解4题获28分，达到银牌水平[16][18] Gemini Deep Think的技术创新 - 采用增强推理模式Deep Think，结合并行思考技术同时探索多种解题路径[29][30] - 通过新颖的强化学习训练，利用多步推理、问题解决和定理证明数据提升能力[31] - 团队提供高质量解决方案集和IMO解题技巧，优化模型表现[33] 解题过程与数学方法 - 第一题解析几何：通过设定引理和定理，证明阳光线数量只能是0、1或3条[37][41][42] - 第二题平面几何：分五步证明，包括确定旁心、求角度、引入辅助点等[44] - 第三题函数分析：通过分类和上下界证明确定最小实数常数c=4[47][50][51] - 第四题数论：通过五步分析确定序列起始值的限制条件[54][55][56][58] - 第五题组合博弈：通过离散化策略和蓄力策略分析胜负条件[64][65] 团队与技术负责人 - 项目由Thang Luong领导，他是Google DeepMind高级主任研究员，斯坦福大学博士[71][72] - Thang Luong在机器翻译、语言模型和视觉模型领域有开创性贡献，曾开发AlphaGeometry项目[72][73] 行业影响与未来展望 - 该突破显示AI在数学推理领域的重大进展，结合自然语言与严谨推理能力[76][77] - 谷歌认为这类AI将成为数学家、科学家和工程师的重要工具[77] - 该技术方向被视为通往AGI道路上的重要里程碑[78] OpenAI与谷歌的对比 - OpenAI此前宣称获得IMO金牌但未经官方认证，谷歌结果获得IMO官方认可[6][81] - OpenAI模型未使用形式语言但依赖外部评委评分，谷歌采用端到端自然语言推理[25][88] - 两家公司在方法上各有侧重，但谷歌的官方认证结果更具权威性[95]