Gemini 3 AI大模型Deep Think模式
搜索文档
“Gemini热潮”再度席卷全球!谷歌Deep Think“硬核升级”直指大型科研工程
智通财经· 2026-02-13 10:10
公司产品升级 - 谷歌对其Gemini 3 AI大模型的Deep Think模式进行了重大升级,聚焦于解决现代科学研究与工程领域的复杂挑战 [1] - 新的Deep Think模式现已在Gemini 3系列AI应用产品中面向Google AI Ultra订阅用户开放 [1] - 这是公司首次通过Gemini API向部分研究人员、工程师及大型企业提供Deep Think功能 [1] 产品功能与定位 - 更新后的Deep Think模式可将草图变为可3D打印的现实物体,拥有分析图纸、对复杂形状建模并生成3D打印文件的能力 [1] - 该模式旨在推动实际应用,使研究人员能深度解读复杂数据,使工程师能通过代码与编程对复杂物理系统进行建模 [2] - 公司将Deep Think定位为从“偏抽象的高强度推理”推向“能在真实科研与工程流程中落地”的专业推理引擎 [2] - 该模式被定义为面向科学、研究与工程挑战的“专用推理模式” [6] 性能表现与基准测试 - 在Humanity's Last Exam上达到48.4%[2],公司称其在该基准上设定了新的行业标准 [4] - 在ARC-AGI-2上取得经ARC Prize基金会验证的84.6% [2][4] - 在Codeforces竞技编程基准中获得3455 Elo [2][4] - 在2025年国际物理奥林匹克竞赛与化学奥林匹克竞赛的笔试部分取得金牌水平 [3][4][5] - 在CMT-Benchmark上取得50.5%的分数 [3][5] 技术能力与影响 - 性能提升同时指向“学术级推理、抽象归纳、工程化算法实现”三条能力曲线的同步抬升 [2] - 能力开始具备跨学科科研问题所需的“物理直觉 + 化学结构化推断 + 数学形式化表达 + 代码化求解”的组合拳 [3] - 关键技术进步在于推理过程的结构化与可扩展的推理算力,通过迭代式推理在多个假设空间并行探索,并在“生成—验证—修正”的闭环中收敛 [6] - 此次升级被描述为引爆新一轮“Gemini AI狂热浪潮”和“Gemini热潮”的点火器 [1][6] 市场与竞争 - 谷歌的Gemini与多款AI产品竞争,包括OpenAI的ChatGPT以及Anthropic的Claude [5] - 此次升级通过API提供早期访问,意味着它更容易被嵌入企业研发链条 [7] - “草图到3D可打印文件”等强演示型能力具备引爆传播的产品特征 [7]
“Gemini热潮”再度席卷全球! 谷歌(GOOGL.US)Deep Think“硬核升级”直指大型科研工程
智通财经· 2026-02-13 09:13
产品发布与升级 - 谷歌对其Gemini 3 AI大模型的Deep Think(深度思考)模式进行了重大升级,聚焦于解决现代科学研究与工程领域的复杂挑战[1] - 新的Deep Think模式现已在Gemini 3系列AI应用产品中面向Google AI Ultra订阅用户开放[1] - 这是公司首次通过Gemini API向部分研究人员、工程师及大型企业提供Deep Think功能[1] - 该模式此前已于2025年11月作为Gemini 3 AI应用产品套件的一部分正式发布[4] 核心功能与应用场景 - 更新后的Deep Think模式可以将草图变为可3D打印的现实物体,拥有强大的能力分析图纸、对复杂形状建模,并生成可用于3D打印的文件[1] - 该模式旨在推动实际应用,使研究人员能够深度解读复杂数据,并使工程师能够通过代码与编程对复杂物理系统进行建模[2] - 其定位是从“偏抽象的高强度推理”进一步推向“能在真实科研与工程流程中落地”的专业推理引擎,帮助用户在边界不清、数据不完备、目标函数复杂的场景下更快逼近可验证的结论与可执行方案[2] - 该模式更容易被嵌入企业研发链条,例如数据分析、仿真建模、代码驱动物理系统建模、自动化实验/设计迭代等[8] 性能表现与基准测试 - 在Humanity's Last Exam(无工具)上达到48.4%,被官方描述为在这一基准上设定了新的行业标准[2][5][7] - 在ARC-AGI-2上取得经ARC Prize基金会验证的84.6%[2][5][7] - 在Codeforces竞技编程基准中获得3455 Elo[2][5] - 在2025年国际物理奥林匹克竞赛与化学奥林匹克竞赛的笔试部分取得了金牌水平的最强劲大模型测试结果[4][5][6] - 在更偏学术的CMT-Benchmark(凝聚态理论)上取得50.5%的分数[4][6] - 去年该模型在数学与编程世界锦标赛中达到了金牌水平[5] 技术特点与能力扩展 - Deep Think的强项已不再局限于数学/编程,开始具备跨学科科研问题所需的“物理直觉+化学结构化推断+数学形式化表达+代码化求解”的组合能力[4] - 其关键不在于“记忆更多知识”,而在于推理过程的结构化与可扩展的推理算力,通过迭代式推理在多个假设空间并行探索,并在“生成—验证—修正”的闭环中不断收敛[8] - 公司披露了以Deep Think驱动的研究型代理,用自然语言验证器去抓逻辑漏洞、触发重写,这类“强验证/强回路”机制是把AI大模型从“会说”推向“能做研究/能做工程”的核心路径[8] 市场定位与竞争 - 谷歌的Gemini与多款AI产品竞争,包括OpenAI的ChatGPT以及Anthropic的Claude[7] - 此次更新被视作全球新一轮“Gemini热潮”的点火器,其“硬指标+明确应用场景”的组合,更容易形成话题聚拢效应与开发者/机构的注意力回流[7]
“Gemini热潮”再度席卷全球! 谷歌(GOOGL.US)Deep Think“硬核升级”直指大型科研工程
智通财经网· 2026-02-13 09:08
公司产品升级 - 谷歌对其Gemini 3 AI大模型的Deep Think模式进行了重大升级,聚焦于解决现代科学研究与工程领域的复杂挑战 [1] - 新的Deep Think模式现已在Gemini 3系列AI应用产品中面向Google AI Ultra订阅用户开放 [1] - 这是公司首次通过Gemini API向部分研究人员、工程师及大型企业提供Deep Think功能 [1] - 升级将Deep Think从“偏抽象的高强度推理”进一步推向“能在真实科研与工程流程中落地”的专业推理引擎 [2] - 此次升级被定义为面向科学、研究与工程挑战的“专用推理模式” [8] 产品功能与应用 - 通过更新后的Deep Think模式,订阅用户可以将草图变为可3D打印的现实物体 [1] - Deep Think拥有强大的能力分析图纸、对极度复杂形状建模,并生成可用于3D打印制作实体物品的文件 [1] - Deep Think旨在推动实际应用,使研究人员能够深度解读复杂数据,并使工程师能够通过代码与编程对复杂物理系统进行建模 [2] - 该模式强调在边界不清、数据不完备、目标函数复杂的场景下,帮助研究者与工程师更快逼近可验证的结论与可执行的方案 [2] - 该产品更容易被嵌入企业研发链条,如数据分析、仿真建模、代码驱动物理系统建模、自动化实验/设计迭代等 [9] 性能表现与基准测试 - 在Humanity's Last Exam上达到48.4%(无工具),被官方描述为设定了新的行业水平 [2][5] - 在ARC-AGI-2上取得经ARC Prize基金会验证的84.6% [2][5] - 在Codeforces竞技编程基准中拿到3455 Elo [2][5] - 在2025国际物理奥赛、化学奥赛笔试部分达到“金牌水平” [4][5][6] - 在更偏学术的CMT-Benchmark上取得50.5% [4][6] - 去年该模型在数学与编程世界锦标赛中达到了金牌水平 [5] 技术能力与影响 - 性能成绩指向“学术级推理、抽象归纳、工程化算法实现”三条能力曲线的同步抬升 [2] - 能力版图开始具备跨学科科研问题所需的“物理直觉+化学结构化推断+数学形式化表达+代码化求解”的组合拳 [4] - 关键不在“记忆更多知识”,而在于推理过程的结构化与可扩展的推理算力 [8] - 通过迭代式推理在多个假设空间并行探索,并在“生成—验证—修正”的闭环中不断收敛 [8] - 公司内部披露了以Deep Think驱动的研究型代理,用自然语言验证器去抓逻辑漏洞,这类“强验证/强回路”机制是把AI大模型从“会说”推向“能做研究/能做工程”的核心路径 [8] 市场定位与竞争 - 谷歌的Gemini与多款AI产品竞争,包括OpenAI的ChatGPT以及Anthropic的Claude [7] - “硬指标+明确应用场景”的组合,更容易形成话题聚拢效应与开发者/机构的注意力回流 [8] - “草图到3D可打印文件”这类强演示型能力,具备引爆传播的产品特征 [9]