Workflow
多智能体模型
icon
搜索文档
谷歌深夜放出 IMO 金牌模型,多项测试力压 Grok 4、OpenAI o3!网友评论两极分化
AI前线· 2025-08-04 14:43
谷歌推出Gemini 2.5 Deep Think功能 - 谷歌向Google AI Ultra订阅用户推出Deep Think功能,订阅价格为每月250美元[2][5] - Gemini 2.5 Deep Think模型在2025年国际数学奥林匹克竞赛(IMO)上夺得金牌[2] - 该模型是谷歌首个公开的多智能体模型,通过并行处理问题提高答案质量[5] Deep Think技术原理 - 采用并行思维技术,同时探索多个想法并整合最佳答案[8] - 延长推理时间使模型能探索不同假设,找到创造性解决方案[9] - 运用新颖的强化学习技术优化推理路径[10] 模型性能表现 - 在LiveCodeBench V6测试中得分87.6%,优于Grok 4(79%)和OpenAI o3(72%)[18] - 在Humanity's Last Exam测试中得分34.8%,高于Grok 4(25.4%)和OpenAI o3(20.3%)[18] - 擅长迭代开发、科学研究和算法开发等需要复杂推理的任务[11][15] 行业反响 - 科技社区对模型表现热烈讨论,部分用户考虑购买Ultra订阅[19][22] - 有用户认为模型在基准测试中表现优异但宣传低调[23] - 部分用户质疑其性价比,认为与竞品相比缺乏明显优势[26] 模型应用场景 - 可协助数学家构建和探索数学猜想[15] - 能推理复杂科学文献,加速科研发现[15] - 特别适合解决需要权衡和时间复杂度分析的编码问题[15]