Gemini Deep Research Agent
搜索文档
腾讯研究院AI速递 20251215
腾讯研究院· 2025-12-15 00:01
生成式AI 一、GPT-5.2上线的24小时,X 大批网友给 GPT-5.2 打差评? 1. OpenAI十周年发布GPT-5.2系列号称"最强专业知识工作模型",但上线24小时后X平台和Reddit用户集体差评, 认为其过于平淡、安全审查过度、情商堪忧; 2. SimpleBench测试显示GPT-5.2得分低于一年前的Claude Sonnet 3.7,在garlic有几个r等简单问题上回答错 误,LiveBench得分低于Opus 4.5和Gemini 3.0; 3. 最受诟病的是安全拒绝机制过于严格,用户反馈模型共情力和语境感知能力下降,在情感支持场景中给出机械且脱 离现实的建议。 https://mp.weixin.qq.com/s/xiOX9i6V-yfnn0pyC6ZlTA 二、OpenAI发布同时,谷歌推出Gemini Deep Research Agent 1. 谷歌在GPT-5.2发布前一小时推出全新版Gemini Deep Research Agent,基于Gemini 3 Pro构建并通过多步强 化学习训练提高准确性减少幻觉; 2. 新版在Humanity's Last Exam测试集 ...
谷歌最新 Gemini Agent 爆击GPT-5.2?人类最后考试得分见分晓!网友:Altman又该发“红色警报”了
AI前线· 2025-12-13 13:33
作者|冬梅 在全球人工智能领域竞争快速升温的当下,谷歌与 OpenAI 再次在同一天抛出重磅更新,令整个行业 的注意力高度集中。 昨天夜里,谷歌发布了全新"重新构想"的 Gemini Deep Research 版本,并首次开放了嵌入式研究智 能体 API。 而几乎同时,OpenAI 正式发布了备受期待的 GPT-5.2(代号 Garlic)。两家公司围绕智能体 (Agent)未来、基础大模型能力边界以及应用生态主导权的竞争,正进入一个前所未有的焦灼阶 段。 这一次,谷歌和 OpenAI 的攻防几乎精确地踩在同一时间窗口,让外界得以清晰观察这两家全球 AI 巨头之间的战略对抗节奏。 谷歌推出全新 Deep Research Agent 谷歌推出的全新 Gemini Deep Research 工具是一款智能 Agent,能够整合海量信息并处理提示信息 中大量的上下文数据。谷歌表示,客户使用 Deep Research Agent 执行的任务范围广泛,从尽职调 查到药物毒性安全研究均有涉及。 谷歌还表示,很快会将这款全新的 Deep Research Agent 集成到其各项服务中,包括谷歌搜索、谷 歌财经、G ...
OpenAI与谷歌竞争不断,半导体设备ETF(159516)涨超2%
每日经济新闻· 2025-12-12 13:57
AI模型技术竞争加剧 - OpenAI推出最新顶级模型GPT-5.2系列,包含Instant、Thinking和Pro模式,距离上一代GPT-5.1仅过去一个月[3] - GPT-5.2被公司称为迄今为止在专业知识工作上最强大的模型系列,在众多基准测试中刷新行业水平,例如在涵盖44个职业的明确知识型工作任务中表现超过行业专家[3] - 谷歌推出Gemini Deep Research深度研究智能体,基于Gemini 3 Pro构建,专为长周期内容收集与综合任务优化,幻觉率降低40%,是谷歌迄今最具事实性的模型[5] 半导体设备行业与ETF表现 - 半导体设备ETF(159516)盘中领涨超2.8%[1] - 该ETF近5日净流入超1.4亿元,年初以来份额增长超160%,当前规模超64亿元,居同类产品第一[1] - 半导体设备ETF跟踪中证半导体材料设备主题指数,聚焦上游半导体设备领域[8] 国产替代与行业成长动力 - 全球AI浪潮对先进算力的渴求推动高端芯片及相关制造需求持续高景气[6] - 在外部环境倒逼下,国内半导体产业核心环节的国产替代已从可选项升级为必选项,为国内设备与材料公司创造了确定性较高、能抵御全球周期波动的内需市场[6] - 国产替代、自主可控核心主线地位得到夯实,AI作为全球大国战略方向,国产算力的渗透率可能在中期达到较高水平,半导体产业链成长动能强劲[7] 半导体设备ETF成分股 - 前十大成分股包括中微公司(权重15.47%)、北方华创(权重14.69%)、拓荆科技(权重5.93%)等公司,均属于信息技术行业[9]
谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%
36氪· 2025-12-12 08:49
智东西12月12日消息,今日凌晨,比OpenAI早一个小时,谷歌甩出了3个Agent大招: Deep Research Agent功能更新,并首次向开发者开放;开源新网络研究Agent基准DeepSearchQA,旨在测试Agent在网络研究任务中的全面性;推出新交 互API(Interactions API)。 Gemini Deep Research是一款专为长期上下文采集和综合任务优化的Agent,其背后的模型是Gemini 3 Pro,通过多步强化学习的扩展搜索,Agent能够自 主地以高精度导航复杂的信息环境。此次更新包括针对特定数据进行网页搜索、更低成本生成研究报告等。 谷歌DeepMind产品经理路卡斯·哈斯( Lukas Haas)在社交平台X上透露,新Gemini Deep Research Agent已经实现SOTA,在谷歌新基准测试上得分 46.4%,在BrowseComp上与GPT-5 Pro相当,价格是其1/10左右。 Deep Research Agent很快将在谷歌搜索、笔记本、谷歌金融中提供,并在Gemini应用中升级。 DeepSearchQA内置了900个手工设计的"因果链 ...