谷歌IMO金牌级Gemini 3深夜上线,华人大神挂帅,OpenAI无力反击
36氪·2025-12-05 18:08

产品发布:Gemini 3 Deep Think - 谷歌DeepMind发布全新推理模型Gemini 3 Deep Think,基于前代Gemini 2.5 Deep Think迭代,在复杂数学、科学和逻辑难题的推理能力上实现质的飞跃[7] - 该模型的核心能力是“并行思考”,可同时探索多种假设以解决超高难度问题[2][14] - 模型在多项基准测试中取得行业领先成绩:在Humanity‘s Last Exam(无工具辅助)上获得41%的高分,在ARC-AGI-2(配合代码执行)上创下45.1%的新纪录[2][7],在ARC-AGI系列测试中实力被描述为无“模”能敌[10] - 产品已上线,所有Gemini App的Ultra订阅用户即可体验[5][11] 技术演示与能力 - 在3D场景生成任务中,Gemini 3 Deep Think相比Gemini 3 Pro展现出更高的还原度和符合物理逻辑的交互光影[5] - 该模型能够根据草图创建精确的交互式3D场景[5],并能生成具备真实物理效果(如碰撞模拟)的游戏关卡和动画[14][16] - 在程序化生成内容(如创建地球类行星)的任务中,Deep Think版本被评价为比Pro版本更具创造力[14] - 开发者实测表明,该模型具备根据静态照片(如玻璃瓶)生成相应3D动画的惊人能力[15][16] 团队与人才战略 - 谷歌DeepMind宣布在新加坡组建一支全新的精英团队,专注于高级推理、大语言模型/强化学习,并推进Gemini及Deep Think等前沿模型的发展[18] - 该团队由华人科学家Yi Tay领导,并向位于山景城、由谷歌Fellow Quoc Le领导的团队汇报,后者是Gemini Deep Think在IMO和ICPC竞赛中获得金牌突破的核心团队之一[18][20] - 团队组建理念强调“人才密度”,初期规模小但能力极强,并已从全球招募顶尖人才[20][21][23] - 团队将与包括“推理之王”Denny Zhou、Noam Shazeer在内的多位AI领域顶尖研究者联动[23] - 该项目得到了谷歌DeepMind内部高层(如Demis Hassabis、Jeff Dean)的大力支持[23] 市场动态与竞争格局 - 随着Gemini 3 Pro的发布,谷歌Gemini的网页端市场份额突破15%大关,目前达到15.1%[26][27] - Gemini的网站访问量达到13.51亿次,较上月(10月)增长14.3%[30] - 尽管ChatGPT在流量上仍断崖式领先,但其市场份额持续下降,目前为71.3%,网站访问量降至58.44亿次,这是其在2025年第二次出现环比下滑[26][27][30] - Grok凭借4.1版本的发布持续增长,市场份额升至2.7%,网站访问量达到2.344亿次,创历史新高,较10月增长14.7%,并首次实现连续两个月流量增长[26][27][33]