谷歌全线开挂!Gemini 3 Deep Think夺多项推理SOTA,Gemini亚洲新团队也官宣了
谷歌谷歌(US:GOOGL) AI前线·2025-12-05 16:41

Gemini 3 Deep Think模式发布与性能表现 - 谷歌正式上线Gemini 3的Deep Think模式,该模式显著加强推理能力,能处理复杂、多步骤及创新的问题,包括超难的科学和数学题 [2] - 在衡量通用智能核心能力的ARC-AGI基准测试中,Gemini 3 Deep Think在两个榜单均拔得头筹 [3][4] - 在测试基础抽象推理的ARC-AGI-1中,其答题正确率达87.5%,击败了GPT-5系列和Claude Opus 4.5等模型 [4] - 在测试高阶推理场景的ARC-AGI-2中,其正确率达45.1%,比非深度思考模式的Gemini 3 Pro(正确率31.1%)高出14%,而GPT-5 Pro在此项正确率仅为18.3% [6] - 在人类最后考试(HLE)和聚焦高阶科学问题的GPQA Diamond两项高难度评测中,Gemini 3 Deep Think也均取得第一名 [7][8] - 目前该模式仅向Google AI Ultra订阅用户开放 [11] 市场与用户反馈 - 社交媒体用户对Deep Think模式在HLE和ARC测试中超过40%的收益率表示赞赏 [13] - 有用户分享实例,称Gemini 3 Deep Think成功解决了一个让其耗费数日的stack underflow bug,其答案比同样能解决该问题的Claude Opus 4.5更明确,且能自信指出bug确切位置,但运行速度较慢 [14][15] - 有用户称赞其创意场景推理能力,称获得了前所未见的最佳输出之一 [16] - 也有用户提出实际使用效果未达预期,希望优化AGI相关功能 [17] 谷歌DeepMind组织与团队动态 - 谷歌DeepMind宣布在新加坡成立全新的Gemini研究团队,由95后华人科学家Yi Tay带队 [20][21] - 新团队将专注于高级推理、LLM/RL以及改进Gemini、Gemini Deep Think等前沿SOTA模型,并向Google Brain创始成员之一Quoc Le汇报 [21] - 位于美国Mountain View的团队近期凭借Gemini Deep Think,已在国际数学奥林匹克竞赛(IMO)和国际大学生程序设计竞赛(ICPC)中斩获金牌 [21] - 团队规模不会很大但人才密度极高,正在招募全球顶尖人才,并与Quoc Le、Denny Zhou、Mostafa Dehghani、Noam Shazeer等AI领域传奇人物合作 [27] - 团队还将吸纳Victor Tran、Lê Minh Thang、薛之、Shane Gu等当代行业顶尖人才 [27] - Gemini团队诞生于2023年谷歌将Google Brain与DeepMind合并为Google DeepMind的重组,旨在整合科研与工程以打造与GPT系列竞争的基础模型 [29][30] - 该团队是一个覆盖算法设计、超大规模训练、多模态系统构建到产品化落地的全链路超级团队,已推出Ultra、Pro、Flash三大全系模型 [30] 谷歌其他AI产品进展 - 谷歌正式推出Google Workspace Studio,深度整合Gmail、Docs、Sheets、Drive、Chat、Calendar等办公应用,允许用户不写代码、在几分钟内创建自己的AI Agent,以自动化从简单提醒到跨系统流程的复杂办公任务 [31] - Workspace Studio基于谷歌最强大的Gemini 3,具备推理、多模态理解和跨应用调用能力,可根据示例自动执行情感分析、内容生成、优先级排序、智能通知等任务 [32] - 有社交媒体用户表示该产品解决了痛点,希望马上使用 [33] - 有用户看好谷歌(股票代码$GOOGL),并猜测是否会有更多企业采用Google Workspace并放弃微软 [34] - 有用户分享使用体验,称其彻底改变了邮件处理方式 [35]