高级版双子座

搜索文档
“深层思维”宣布人工智能测试得分达国际数学奥赛金牌水平
新华社· 2025-07-22 15:30
人工智能模型性能突破 - 谷歌旗下"深层思维"公司高级版"双子座"模型在国际数学奥林匹克竞赛(IMO)测试中获35分(总分42分),达到金牌水平[1] - 模型成功解答2025年竞赛6道题目中的5道,解题方案获官方认证且被评价为"清晰、精确"[1] - 相比2024年AlphaProof与AlphaGeometry 2组合28分(银牌水平)的表现,得分提升25%[2] 技术实现进展 - 高级版"双子座"直接根据自然语言描述解题,无需人工翻译为计算机语言,突破去年技术限制[2] - "深度思考"模式采用并行思维技术,可同时探索多种解决方案路径而非单一线性思路[2] - 解题时间从去年2-3天缩短至竞赛标准时限(4.5小时/天×2天),实现与人类选手同等条件[2] 行业应用验证 - IMO竞赛成为衡量AI解决复杂数学问题能力的权威标准,涉及代数/组合数学/几何/数论四大领域[1] - 官方评分员确认AI解题方案"大多数易于理解",表明技术已具备可解释性[1] - 公司公开全部解题方案,为行业提供可验证的技术基准[1]