Google launched its deepest AI research agent yet — on the same day OpenAI dropped GPT-5.2
谷歌谷歌(US:GOOG) TechCrunch·2025-12-12 08:18

谷歌发布新版Gemini Deep Research - 谷歌发布了基于其先进基础模型Gemini 3 Pro的“重新构想”版研究代理Gemini Deep Research [1] - 新版代理不仅能生成研究报告,还允许开发者通过新的Interactions API将谷歌的SATA模型研究能力嵌入自己的应用程序中 [1] - 该工具旨在综合海量信息并处理提示中的大型上下文,客户将其用于从尽职调查到药物毒性安全研究等任务 [2] 产品集成与性能特点 - 谷歌计划很快将该深度研究代理集成到多项服务中,包括谷歌搜索、谷歌财经、Gemini应用及其流行的NotebookLM [3] - 深度研究受益于Gemini 3 Pro作为其“最真实”模型的地位,该模型经过训练可最大限度减少复杂任务中的幻觉 [3] - 对于需要长时间深度推理的代理任务,幻觉问题尤为关键,因为即使一个错误选择也可能使整个输出无效 [4] 基准测试与竞争对比 - 谷歌创建并开源了名为DeepSearchQA的新基准,用于测试代理在复杂、多步骤信息检索任务上的表现 [5] - 谷歌还在名为“Humanity's Last Exam”的独立通用知识基准和浏览器代理任务基准BrowserComp上测试了Deep Research [7] - 谷歌的新代理在其自有基准和Humanity's基准上超越了竞争对手,但OpenAI的ChatGPT 5 Pro在所有方面都紧随其后,并在BrowserComp上略微领先谷歌 [7] 行业竞争动态 - 在谷歌发布基准测试结果几乎同时,OpenAI推出了备受期待的GPT 5.2(代号Garlic)[8] - OpenAI表示其最新模型在一系列典型基准测试(包括其自研基准)上超越了竞争对手,尤其是谷歌 [9] - 谷歌选择在业界等待Garlic发布的时间点宣布其AI新闻,这一时机选择是此次公告最有趣的部分之一 [9]