Workflow
科研工程
icon
搜索文档
“Gemini热潮”再度席卷全球! 谷歌(GOOGL.US)Deep Think“硬核升级”直指大型科研工程
智通财经网· 2026-02-13 09:08
公司产品升级 - 谷歌对其Gemini 3 AI大模型的Deep Think模式进行了重大升级,聚焦于解决现代科学研究与工程领域的复杂挑战 [1] - 新的Deep Think模式现已在Gemini 3系列AI应用产品中面向Google AI Ultra订阅用户开放 [1] - 这是公司首次通过Gemini API向部分研究人员、工程师及大型企业提供Deep Think功能 [1] - 升级将Deep Think从“偏抽象的高强度推理”进一步推向“能在真实科研与工程流程中落地”的专业推理引擎 [2] - 此次升级被定义为面向科学、研究与工程挑战的“专用推理模式” [8] 产品功能与应用 - 通过更新后的Deep Think模式,订阅用户可以将草图变为可3D打印的现实物体 [1] - Deep Think拥有强大的能力分析图纸、对极度复杂形状建模,并生成可用于3D打印制作实体物品的文件 [1] - Deep Think旨在推动实际应用,使研究人员能够深度解读复杂数据,并使工程师能够通过代码与编程对复杂物理系统进行建模 [2] - 该模式强调在边界不清、数据不完备、目标函数复杂的场景下,帮助研究者与工程师更快逼近可验证的结论与可执行的方案 [2] - 该产品更容易被嵌入企业研发链条,如数据分析、仿真建模、代码驱动物理系统建模、自动化实验/设计迭代等 [9] 性能表现与基准测试 - 在Humanity's Last Exam上达到48.4%(无工具),被官方描述为设定了新的行业水平 [2][5] - 在ARC-AGI-2上取得经ARC Prize基金会验证的84.6% [2][5] - 在Codeforces竞技编程基准中拿到3455 Elo [2][5] - 在2025国际物理奥赛、化学奥赛笔试部分达到“金牌水平” [4][5][6] - 在更偏学术的CMT-Benchmark上取得50.5% [4][6] - 去年该模型在数学与编程世界锦标赛中达到了金牌水平 [5] 技术能力与影响 - 性能成绩指向“学术级推理、抽象归纳、工程化算法实现”三条能力曲线的同步抬升 [2] - 能力版图开始具备跨学科科研问题所需的“物理直觉+化学结构化推断+数学形式化表达+代码化求解”的组合拳 [4] - 关键不在“记忆更多知识”,而在于推理过程的结构化与可扩展的推理算力 [8] - 通过迭代式推理在多个假设空间并行探索,并在“生成—验证—修正”的闭环中不断收敛 [8] - 公司内部披露了以Deep Think驱动的研究型代理,用自然语言验证器去抓逻辑漏洞,这类“强验证/强回路”机制是把AI大模型从“会说”推向“能做研究/能做工程”的核心路径 [8] 市场定位与竞争 - 谷歌的Gemini与多款AI产品竞争,包括OpenAI的ChatGPT以及Anthropic的Claude [7] - “硬指标+明确应用场景”的组合,更容易形成话题聚拢效应与开发者/机构的注意力回流 [8] - “草图到3D可打印文件”这类强演示型能力,具备引爆传播的产品特征 [9]