Workflow
中信证券:建议关注以多模态为代表的应用机会 同步关注模型发展带来的算力新需求
智通财经网·2025-11-20 09:00

文章核心观点 - Google发布最新基座模型Gemini 3 Pro,其多模态理解和逻辑推理两大关键能力显著提升,多模态性能表现达到领先水平 [1] - 模型围绕Agent开发、代码生成、用户交互等关键能力持续升级,在主流测试集上达到领先水平,目前已全面向Search、Gemini app、AI Studio、Vertex AI、Google Antigravity等渠道开放 [1] - 建议关注以多模态为代表的应用机会,同步关注模型发展带来的算力新需求 [1][8] 多模态能力 - Google将Gemini 3 Pro定位为"世界最好的多模态理解模型",强调其综合利用多种模态信息进行推理思考的能力 [2] - 在理解+推理测试集MMMU-Pro/Video-MMMU上分别得分81.0%/87.6%,较GPT-5.1的76.0%/80.4%有明显提升 [2] - 在测试GUI交互能力的ScreenSpot-Pro测试集上正确率达到72.7%,大幅超越Claude Sonnet 4.5的36.2% [2] - 模型多模态能力是从最初开始构建,原生多模态架构创新带来性能显著领先 [1][2] 推理能力 - Gemini 3 Pro在主流推理测试集上性能优异,GPQA Diamond测试集上得分91.9%,略微领先于GPT-5.1 [3] - HLE测试集上无工具调用正确率达到37.5%,较GPT-5.1的26.5%有明显提升 [3] - 深度思考模式下模型在HLE测试集上正确率进一步提升到41%,ARC-AGI-2成绩为45.1%,大幅超越GPT-5.1的17.6% [3] - SimpleQA Verified测试集上正确率达到72.1%,较GPT-5.1的34.9%有大幅领先,反映模型知识丰富度和信息准确性提升 [3] Agent能力 - 模型工具调用能力与GPT-5.1、Claude 4.5 Sonnet相比有小幅领先,任务规划能力表现更好,支持100万Tokens上下文窗口长度 [4] - 长上下文精确检索测试集性能大幅领先,结合推理和多模态理解能力升级,展示更丰富的Agent开发潜力 [4] - 发布全新Agent开发平台Google Antigravity,整合模型、代码助手、外部工具、可视化开发环境等,覆盖完整端到端开发工作流 [6] 编程能力 - 在swe-bench verified等关键测试集上与Claude 4.5 Sonnet能力相近,更多侧重网页UI为代表的前端开发能力 [4] - WebDev Arena上得分达到1487,超越GPT-5.1和Claude 4.5 Sonnet等模型 [5] - 通过实时的用户界面改造能力,Google Search可以用视觉结合文本的方式更有效阐述结论 [5] 生态系统 - To C端将Gemini App作为统一入口,当前Gemini app MAU超6.5亿,超过70%的Google Cloud用户使用Google的AI服务 [6] - 超过1300万开发者使用Gemini模型进行应用开发,通过丰富的Agent工具提升用户粘性 [6] - To D端通过Google Antigravity平台培育丰富Agent生态,将开发者思路快速转化成可落地的Agent产品 [6]