Workflow
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4
量子位·2025-08-02 09:33

产品发布与更新 - 谷歌DeepMind推出Gemini 2 5 Deep Think模型 已在Gemini App中上线[3] - 发布版本与IMO金牌版本略有不同 速度更快但实力稍逊 仅达铜牌水平[4][5][6] - 模型仅对Ultra订阅用户开放 月费249 99美元 约合人民币1803元[7] 性能表现与对标 - 推理性能超越OpenAI的o3和马斯克的Grok 4[8] - 在LiveCodeBench V6和Humanity's Last Exam测试中均取得最佳成绩[10] - 擅长编码 科学 知识和推理能力[9] 技术原理与优势 - 采用并行思维技术 拓展思维能力边界 可一次性生成众多想法并修正结合[14][15] - 延长推理时间 探索不同假设 找到创造性解决方案[16] - 迭代式开发能力突出 提升网页开发任务的美观性和功能性[12] 应用场景 - 可深度阅读论文 融合不同论文观点 非简单复述[17] - 协助数学猜想探索和科学文献推理 加速科研发现[18] - 擅长算法开发与代码编写 能精细考量问题表述和时间复杂度[18] 行业影响 - 模型展示谷歌在AI推理领域的领先技术实力[8][10] - 高性能订阅模式可能重塑AI产品商业化路径[7] - 在科研和工程领域的应用潜力显著[17][18]