Workflow
计算机行业重大事项点评:Google:Gemini3开启全模态革命
谷歌谷歌(US:GOOG) 华创证券·2025-11-24 22:15

报告行业投资评级 - 计算机行业投资评级为“推荐(维持)” [4] 报告核心观点 - Google正式发布Gemini 3,该模型不仅是全球领先的多模态理解模型,更是Google迄今为止最强大的智能体和氛围编程模型,其性能全面进化,强化了Google在AI竞赛中的领先地位 [2][7] - Gemini 3 Deep Think增强推理模式开启了深度思考新纪元,显著拓展智能边界 [7] - Google推出全新智能体开发平台Antigravity,迈向以任务为导向的Agent新阶段 [7] - Google凭借“芯片-模型-生态”三位一体的全栈式战略,构筑了深厚的竞争壁垒 [7] 一、Gemini 3:性能全面进化,强化 Google AI 竞赛领先地位 - Gemini 3以1501分登顶LMArena排行榜,在推理、数学及多模态领域均创下最佳成绩 [7][10] - 模型在“人类终极考试”中无工具辅助得分率达37.5%,GPQA Diamond基准测试准确率达91.9%,MathArena Apex测试成绩达23.4% [10] - 多模态理解方面表现突出,在MMMU-Pro和Video-MMMU上分别获得81%与87.6%的成绩,SimpleQA Verified基准测试得分72.1% [10] - 依托百万token上下文窗口,实现“学习、构建、规划”三大突破,可将视频、论文转化为交互学习材料 [7][13] - 在编程基准中表现卓越,WebDev Arena Elo评分1487,Terminal-Bench 2.0成绩54.2%,SWE-bench Verified成绩76.2%,LiveCodeBench Pro成绩2439分 [7][14] 二、Gemini 3:Deep Think 开启深度思考新纪元 - Gemini 3 Deep Think模式在“人类最终考试”中无工具辅助得分率达到41.0%,GPQA Diamond测试准确率提升至93.8% [7][15] - 在启用代码执行的ARC-AGI-2基准测试中取得45.1%的突破性成绩 [7][15] 三、Google:全新智能体开发平台 Antigravity,迈向 Agent 新阶段 - Antigravity平台深度集成Gemini 3的强大推理与编码能力,将模型从辅助工具升级为能自主规划、执行并验证复杂软件工程的活跃伙伴 [7][17] - 平台为智能体提供专属界面,赋予其直接操作编辑器、终端和浏览器的权限,并融合了Gemini 2.5 Computer Use模型及Nano Banana图像编辑模型 [7][17] - Gemini 3在Vending-Bench 2测试中展现出卓越长期规划能力,面向订阅用户推出可处理多步骤工作流程的Gemini Agent功能 [7][17] 四、Google:“芯片-模型-生态”全栈式战略,构筑深厚壁垒 - 硬件层面基于自研Trillium TPU实现算力较前代提升4倍,新一代Ironwood TPU有望将性能提升10倍,支持单集群连接9,216颗芯片 [7][20] - 开发者生态方面,通过AI Studio、Antigravity等平台提供完整工具链,拥有1300万开发者 [7][20] - 应用层面深度整合至月活20亿的搜索等产品,Gemini系列月活用户突破6.5亿,获超70%云端客户采用 [7][20] 五、投资建议 - 建议关注AI细分景气方向,包括国产算力、企业服务(办公、多模态、ERP、OA、编程、营销)以及多个应用场景(金融、教育、法律、医疗、电商、安全、工业、军用) [7][22][24]