Workflow
Deep Think模式
icon
搜索文档
?“Gemini热潮”再度席卷全球! 谷歌(GOOGL.US)Deep Think“硬核升级”直指大型科研工程
智通财经· 2026-02-13 09:26
核心观点 - 谷歌对其Gemini 3 AI大模型的Deep Think模式进行了重大升级,旨在解决现代科学与工程领域的复杂挑战,并已面向Google AI Ultra订阅用户及部分研究人员、工程师和企业开放 [1] - 此次升级将Deep Think从高强度推理引擎推向可在真实科研与工程流程中落地的专业工具,并凭借在多项硬核基准测试中创纪录的表现,被视为设定了新的行业标准,引爆了新一轮“Gemini热潮” [2][4][7] 产品升级与发布 - Deep Think模式现已在Gemini 3系列AI应用产品中面向Google AI Ultra订阅用户开放 [1] - 公司首次通过Gemini API向部分研究人员、工程师及大型企业提供Deep Think功能 [1] - 升级后的功能更容易被嵌入企业研发链条,例如数据分析、仿真建模等 [8] 核心能力与性能表现 - 更新后的Deep Think模式可以将草图变为可3D打印的现实物体,具备分析图纸、对复杂形状建模并生成3D打印文件的能力 [1] - 在Humanity‘s Last Exam基准测试中达到48.4%的分数,无工具辅助,被官方描述为设定了新的行业标准 [2][4] - 在ARC-AGI-2推理任务基准测试中取得84.6%的分数,并经ARC Prize基金会验证 [2][4] - 在Codeforces竞技编程基准中获得3455 Elo评分 [2][4] - 在2025年国际物理奥林匹克竞赛和化学奥林匹克竞赛的笔试部分达到“金牌水平” [3][4][5] - 在更偏学术的CMT-Benchmark上取得50.5%的分数 [3][5] 技术定位与应用场景 - Deep Think被定义为面向科学、研究与工程挑战的“专用推理模式” [7] - 其关键不在于记忆更多知识,而在于推理过程的结构化与可扩展的推理算力,通过迭代式推理在多个假设空间并行探索 [7] - 旨在推动实际应用,帮助研究人员深度解读复杂数据,并帮助工程师通过代码与编程对复杂物理系统进行建模 [2] - 强调在边界不清、数据不完备、目标函数复杂的场景下,帮助研究者与工程师更快逼近可验证的结论与可执行的方案 [2] - 开始具备跨学科科研问题所需的“物理直觉 + 化学结构化推断 + 数学形式化表达 + 代码化求解”的组合能力 [3] 行业竞争 - 谷歌的Gemini AI产品与OpenAI的ChatGPT以及Anthropic的Claude等AI产品存在竞争关系 [6]