Workflow
Gemini Deep Think
icon
搜索文档
AI拿下奥数IMO金牌,但数学界的AlphaGo时刻还没来
36氪· 2025-08-01 10:40
伴随技术进展而来的,是行业竞争"好戏":当Demis Hassabis公开谴责OpenAI提前泄露成绩时,媒体曝出DeepMind金牌团队三名核心研究员已被Meta挖 角。 AI数学能力的进步速度令人惊叹。但IMO金牌究竟意味着什么?这是数学界的AlphaGo时刻吗?AI将会成为数学研究中值得信赖的合作者,还是沦为市场 逻辑下的技术产品,消解数学的真正意义? 最近,2025年国际数学奥林匹克(IMO)在澳大利亚落幕的两天内,AI界因"IMO金牌认证",开展了一场人才与技术话语权的双重争夺战。 OpenAI抢先宣布其保密推理模型以35分达到金牌线,DeepMind两天后也亮出IMO官方认证的同等成绩单。这标志着AI首次在IMO中比肩顶尖学生,实现 从2024年银牌到2025年双金牌的数学推理能力跃升。 本篇文章,我们邀请了IMO金牌得主,以亲历者的角度来聊聊两大AI的解题逻辑和数学水平,并透视竞赛背后的技术突破与数学的未来。 01 前后获得IMO金牌,DeepMind与OpenAI之战 一觉醒来,我以为我穿越回高中了:朋友圈竟然有人提起IMO(国际数学奥林匹克竞赛,International Mathemati ...
不怕被挖!谷歌晒IMO金牌团队大合照,还挨个圈出了联系方式
量子位· 2025-07-25 15:59
谷歌DeepMind IMO金牌团队事件 - 谷歌DeepMind团队在IMO2025前夕集结全球核心成员进行冲刺训练,最终完成Gemini Deep Think模型的最终训练,使其性能达到巅峰状态[10][11][13] - 团队负责人Thang Luong公开晒出团队全家福,回应此前Meta挖走3名核心成员的事件,合照中未出现被挖走的3名华人成员[3][4][8][17] - 团队在训练过程中面临计算资源不足的问题,需要从多个团队东拼西借资源[12] 团队成员背景 - Thang Luong担任DeepMind超级推理团队负责人,是IMO金牌团队的核心领导者[4] - Yi Tay是团队联合负责人,曾参与谷歌PaLM、UL2、Flan-2、Bard等大模型研发,撰写45篇论文(16篇一作),后因创业期间健康问题重返谷歌[21][22][25] - Quoc Le作为Google Brain创始人之一,拥有斯坦福大学计算机科学博士学位,师从吴恩达[27] - Dawsen Hwang曾两次参加IMO并获得银牌和金牌,拥有MIT硕士和博士学位[33] - Jieming Mao本科就读清华大学,获普林斯顿大学计算机科学博士学位[35] 团队其他核心成员 - Andreas Kirsch在慕尼黑工业大学和牛津大学完成学业,现任Google DeepMind研究科学家[29] - Theophane Weber拥有MIT运筹学博士学位,曾在Analog Devices担任研究科学家[31] - Jonathan Lee主攻强化学习,获斯坦福大学计算机科学博士学位[37] - Vinay Ramasesh专注于量子处理器研究,获加州大学伯克利分校实验物理学博士学位[39] - Lei Yu在牛津大学完成博士研究,2017年加入Google DeepMind[41] - Zicheng Xu高中成绩全优(GPA满分),获莱斯大学双学位,计划攻读约翰霍普金斯大学博士学位[42]
全球首个IMO金牌AI诞生!谷歌Gemini碾碎奥数神话,拿下35分震惊裁判
首席商业评论· 2025-07-23 12:02
谷歌DeepMind在IMO竞赛中的突破 - 谷歌DeepMind的Gemini Deep Think模型在IMO竞赛中破解5道题,获得35分(满分42分),达到金牌标准[3][4][21] - 该模型在4.5小时内完成解题,使用纯自然语言(英语)进行端到端推理,无需形式语言翻译[5][25] - 这是首个获得IMO组委会官方认证的金牌级别AI系统[6][7] IMO竞赛背景与AI参与情况 - IMO是数学界最高级别竞赛,每年吸引全球顶尖学生参与,需在4.5小时内解决6道深度数学问题[10][11] - 只有前8%的选手能获得金牌[12] - 2024年AlphaProof和AlphaGeometry 2破解4题获28分,达到银牌水平[16][18] Gemini Deep Think的技术创新 - 采用增强推理模式Deep Think,结合并行思考技术同时探索多种解题路径[29][30] - 通过新颖的强化学习训练,利用多步推理、问题解决和定理证明数据提升能力[31] - 团队提供高质量解决方案集和IMO解题技巧,优化模型表现[33] 解题过程与数学方法 - 第一题解析几何:通过设定引理和定理,证明阳光线数量只能是0、1或3条[37][41][42] - 第二题平面几何:分五步证明,包括确定旁心、求角度、引入辅助点等[44] - 第三题函数分析:通过分类和上下界证明确定最小实数常数c=4[47][50][51] - 第四题数论:通过五步分析确定序列起始值的限制条件[54][55][56][58] - 第五题组合博弈:通过离散化策略和蓄力策略分析胜负条件[64][65] 团队与技术负责人 - 项目由Thang Luong领导,他是Google DeepMind高级主任研究员,斯坦福大学博士[71][72] - Thang Luong在机器翻译、语言模型和视觉模型领域有开创性贡献,曾开发AlphaGeometry项目[72][73] 行业影响与未来展望 - 该突破显示AI在数学推理领域的重大进展,结合自然语言与严谨推理能力[76][77] - 谷歌认为这类AI将成为数学家、科学家和工程师的重要工具[77] - 该技术方向被视为通往AGI道路上的重要里程碑[78] OpenAI与谷歌的对比 - OpenAI此前宣称获得IMO金牌但未经官方认证,谷歌结果获得IMO官方认可[6][81] - OpenAI模型未使用形式语言但依赖外部评委评分,谷歌采用端到端自然语言推理[25][88] - 两家公司在方法上各有侧重,但谷歌的官方认证结果更具权威性[95]
AI首夺数学奥赛金牌!谷歌Gemini闪耀IMO赛场 OpenAI同步“摘金”
智通财经网· 2025-07-22 21:28
谷歌AI模型表现 - 谷歌旗下Gemini Deep Think的先进版本在国际数学奥林匹克竞赛中解答了六道题目中的五道,总得分35分(满分42分),达到金牌级别表现[1] - 该模型以自然语言进行端到端运算,在4.5小时竞赛时限内直接根据题目描述完成严谨数学证明[1] - 去年谷歌DeepMind的AlphaProof和AlphaGeometry 2组合系统获得银牌,解答四道题得分28分[1] - 国际数学奥林匹克竞赛主席确认谷歌DeepMind达到里程碑,评委认为其解答清晰、准确且易于理解[2] - 谷歌计划在向Google AI Ultra订阅用户推出前,先向受信任测试人员(包括数学家)提供该模型版本[2] OpenAI实验模型进展 - OpenAI实验性推理大语言模型在国际数学奥林匹克竞赛评估中解答六道题中的五道,总得分35分(满分42分),达到金牌水平[2][3] - 评估采用与人类参赛者相同规则:两场4.5小时考试,禁用工具/网络,需阅读题目并以自然语言书写证明[2] - 每道题由三位国际数学奥林匹克竞赛奖牌获得者独立评分,最终分数经一致确认[3] - 该模型为实验性研究版本,未来几个月内无计划发布具备此数学能力的产品[3] 行业里程碑意义 - 这是人工智能系统首次在面向高中生的国际数学奥林匹克竞赛中跨越金牌得分门槛[3]
Altman 秀新模型“翻车”,谷歌补刀躺赢!OpenAI 前员工爆肝3天,编程再赢老东家模型!
AI前线· 2025-07-22 17:32
OpenAI新模型进展 - OpenAI近期测试多款未公开新模型 包括疑似GPT-5的o3-alpha-responses-2025-07-17模型和编程竞赛亚军模型OpenAIAHC [1][5][7][8][10] - o3 Alpha模型在Web开发测试中表现惊艳 仅上线5-6小时后下架 可能在未来几周正式发布 [5][7][8] - OpenAI CEO曾暗示公司内部有全球前50编程能力的模型 2025年底可能推出超人类级编程模型 [8] 国际数学奥林匹克竞赛表现 - OpenAI宣布实验性AI模型在IMO取得金牌成绩 达到前9%人类选手水平 在4.5小时限制下完成6道证明题 [2][3] - 谷歌DeepMind的Gemini Deep Think在IMO六题中答对五题 达到金牌水平 此前AlphaProof和AlphaGeometry 2仅获银牌 [2][4] - OpenAI因提前公布成绩和自行评分引发争议 被质疑违反IMO保密协议和评分标准 [3][4] 编程竞赛表现 - OpenAI的OpenAIAHC模型在AtCoder世界巡回赛总决赛中获得亚军 得分1,654,675,725,406 不敌人类冠军的1,812,272,588,909 [10][11][12] - 这是AI首次在顶级编程竞赛中进入前三名 展示出战略性推理和长期规划能力 [12][13] - 比赛采用10小时限时赛制 参赛者使用相同硬件 每次提交需间隔5分钟 [10] 行业动态 - 谷歌DeepMind CEO批评OpenAI过早公布IMO成绩 强调应尊重官方验证流程 [4] - 多家AI公司被IMO要求推迟至7月28日公布结果 但OpenAI提前宣布引发不满 [4] - 行业观察显示AI在编程和数学竞赛中进步显著 可能很快超越人类顶尖选手 [13]
DeepMind夺得IMO官方「唯一」金牌,却成为OpenAI大型社死现场
机器之心· 2025-07-22 12:25
技术突破 - 谷歌DeepMind新一代Gemini进阶版模型在IMO竞赛中达到金牌得主水平,成功解决六道超高难度试题中的五道,拿下35分(满分42分),成为首个获得奥赛组委会官方认定为金牌的AI系统[2] - 该系统首次证明人工智能无需依赖专业编程语言,仅通过自然语言理解即可攻克复杂数学难题[3] - 突破来自Gemini Deep Think增强型推理系统,采用并行思维技术,同时探索多种可能解决方案[6] - 模型以自然语言进行端到端运行,直接从官方问题描述中生成严格数学证明,并在比赛标准的4.5小时时限内完成任务[7] 行业对比 - 谷歌DeepMind成绩远超2024年表现,当时AlphaProof和AlphaGeometry系统组合解决六个问题中的四个,荣获银牌[4] - 谷歌谨慎发布方式赢得AI界广泛赞誉,与竞争对手OpenAI对类似成绩处理方式形成鲜明对比[11] - OpenAI因绕过官方竞赛规则提前官宣遭到批评,被指缺乏可信度[10][15] - DeepMind选择等待官方认可再发布成绩,赢得金牌和尊重,而OpenAI因时机与方式问题引发争议[25] 技术方法 - OpenAI研究科学家表示谷歌方法与其不同,说明存在多种研究方向[17] - OpenAI专注于不受Lean限制的自然语言通用推理研究,因此婉拒IMO基于Lean语言的正式比赛邀请[18] - OpenAI在通用推理方面取得进展,包括收集、整理和训练高质量数学数据,未使用RAG或任何工具[19] - OpenAI提交的每份证明由三位外部IMO奖牌获得者评分并获得一致正确性认可,证明已公开发布供验证[20][21] 行业影响 - 这场AI登上数学奥林匹克舞台的较量不仅是技术竞赛,更是关于规范、节奏与合作精神的展示[25] - 在通往AGI的路上,除了技术力,如何与人类社会的规则与价值观对齐正变得愈发重要[25] - AI推理能力正在快速发展,IMO结果确实表明了这一点[24]
全球首个IMO金牌AI诞生!谷歌Gemini碾碎奥数神话,拿下35分震惊裁判
猿大侠· 2025-07-22 11:33
核心观点 - 谷歌DeepMind的Gemini Deep Think模型在IMO竞赛中以自然语言方式破解5道题,获得35分(满分42分),达到金牌标准[3][4][22] - 该成绩获得IMO组委会官方认证,成为首个获此认可的AI系统[6][7][24] - 模型突破在于完全使用自然语言端到端推理,无需形式语言翻译,且在4.5小时比赛时限内完成[26][29] - 相比2024年AlphaProof和AlphaGeometry 2解决4题获28分(银牌)的表现有显著提升[17][19] - 技术核心是Deep Think增强推理模式,结合并行思考技术和强化学习训练[32][33][35] 技术实现 - 采用并行思考技术,同时探索多种解题路径并整合最优答案[33][34] - 通过新颖的强化学习训练,利用多步推理和定理证明数据提升能力[35] - 提供高质量数学问题解决方案集和IMO解题技巧作为知识库[42] - 模型即将向数学家测试者和Google AI Ultra订阅者开放[39] 解题案例 - 第一题(解析几何):通过设定引理和分类讨论,证明阳光线数量只能是0、1或3条[44][45][52] - 第二题(平面几何):分五步证明,包括确定旁心位置和引入辅助点性质[54][55][59] - 第三题(函数):通过上界证明c≤4和下界证明c≥4确定最小实数常数为4[65][66][67] - 第四题(数论):用五步证明序列性质,包括偶数性分析和动态行为研究[73][74][78] - 第五题(组合博弈):通过离散化策略和蓄力战术,确定Alice与Bazza的必胜条件区间[84][85][86] 行业影响 - IMO成为AI能力试炼场,数学推理能力接近顶尖人类水平[16][19] - 自然语言与形式化推理结合的AI将成为科研人员重要工具[105] - 谷歌与OpenAI的竞争凸显技术路线差异:官方认证vs自评结果[108][109][129] - OpenAI被质疑未获官方认证且提前公布结果,影响行业声誉[109][112][130] 团队背景 - 项目由Thang Luong领导,他是机器翻译深度学习先驱和注意力机制发明者[95][96][97] - 团队曾开发AlphaGeometry、LaMDA、Bard等知名项目[98]