谷歌的阳谋：在GPT-5.2发布日，推出史上“最深度”研究型Agent

核心观点 - 谷歌在OpenAI发布GPT-5.2的同日，同步推出了其迄今最强的深度研究型Agent——Gemini Deep Research的“重制版”，此举被视为一场主动的正面竞争，旨在定义并抢占未来AI Agent时代的基础设施级入口[2][3][10] - 谷歌正试图将Gemini Deep Research从传统的报告生成工具，转变为可处理海量信息、支持长链推理、并能被嵌入各类应用的“AI研究内核”，其目标是成为未来信息访问的底层能力，即“搜索引擎底层能力”[4][5] - 未来的信息获取方式可能发生根本性转变，从用户主动“谷歌一下”变为由用户的Agent代理一切信息检索与研究任务[2][7] 产品定位与战略意图 - 全新Gemini Deep Research被定位为三个方向：可处理大规模上下文、消化“信息山脉”的深度研究Agent；可被开发者直接嵌入App的“AI研究内核”；能持续执行数分钟至数小时多步骤任务的长链式推理Agent[5] - 谷歌推出全新的Interactions API，旨在将“搜索+多步骤推理+评估”打包成操作系统级服务，以方便开发者将Deep Research能力嵌入自身应用，这标志着谷歌正把Agent推向操作系统级能力[3][5] - 谷歌宣布Deep Research将陆续进入谷歌搜索、谷歌财经、Gemini应用以及NotebookLM等核心产品，加速其能力的内嵌与普及[6] - 谷歌此举的战略意图是在AI Agent化快速发展之际，提前占据开发者入口，其与OpenAI的竞争已从模型战争转向争夺未来信息访问方式的基础设施主导权[10] 技术性能与基准测试 - 谷歌称Deep Research受益于其最先进的Gemini 3 Pro模型的“更高事实性”，旨在降低在持续数十分钟甚至数小时的长链推理任务中因幻觉累积导致的结果失真，这是AI走向Agent后的最大痛点之一[8] - 为验证性能，谷歌发布了新的DeepSearchQA基准用于测试多步骤信息检索，并已开源该基准[8] - 在谷歌自有基准和“人类最后考试”（Humanity‘s Last Exam）基准测试中，新的Deep Research Agent击败了竞争对手，但OpenAI的ChatGPT 5 Pro表现接近，并在BrowserComp测试中略胜谷歌[8] - 文章指出，这些基准比较在发布时几乎已过时，因为同一天OpenAI发布了GPT-5.2，号称智能体编码最强并赶超人类专家，且声称在一系列典型基准测试中击败了包括谷歌在内的竞争对手[9] 行业竞争格局 - 谷歌选择与OpenAI GPT-5.2发布日同步公布Deep Research，是一次极具戏剧性的“正面交锋”，凸显了两大巨头在AI Agent时代的直接竞争[3][10] - 同日，谷歌旗下DeepMind还宣布将在英国建立首个自动化研究实验室，利用AI与机器人加速材料科学实验，展示了其在AI应用前沿的全面布局[3] - 行业正处在走向“Agent时代”的关键节点，AI Agent被视为有望成为新一代的“搜索框”，基础设施级的入口争夺战已经打响[3][10]