Search Agents
搜索文档
GoogleI/O2026:3.5Flash模型更快更便宜,Spark+SearchAgent占据C端入口
海通国际证券· 2026-05-20 23:10
行业与公司事件 - Google于2026年5月19日举办I/O开发者大会,围绕模型、编程、智能体三条主线发布多项产品[1] - 报告认为Google正利用其C端分发优势加速智能体商业化落地,其优势包括拥有25亿月活的搜索、Gemini App和YouTube[1] 模型层:Gemini 3.5 Flash - Gemini 3.5 Flash模型已全量上线所有Google产品和API,并成为Gemini App与搜索AI模式的默认模型[2] - 该模型输出速度达每秒289个token,比GPT-5.5和Claude Opus 4.7快4倍以上,且价格比同级前沿模型便宜超过一半[2][9] - 在几乎所有基准测试中,其性能超越了Google自家三个月前发布的旗舰模型Gemini 3.1 Pro[2] - 成本测算显示,头部客户若将80%工作负载切换至3.5 Flash,每年可节省超过10亿美元的API成本[2] - 报告认为该模型以前沿性能加半价定价的组合,将进一步压缩行业API均衡价格区间,对竞争对手形成显著定价压力[2] 模型层:Gemini Omni - Gemini Omni的核心跨越在于能够编辑已有视频而不破坏原有人物表演,例如换背景、加特效、加角色,同时保持人物表情、肢体、节奏不变[3] - 该模型实现了原生音视频同步生成,画面、配乐、音效可在同一次推理中输出[3] - SynthID水印已累计为1000亿张图像和视频打上标记[3] 编程平台:Antigravity 2.0 - Antigravity 2.0编程平台使用93个子智能体,在12小时内,以不到1000美元的总API成本,从零构建了一个完整的操作系统并成功运行Doom游戏[4] - 该演示处理了超过1.5万次模型请求,处理了26亿个token[4] - Google内部token处理速度从3月的每天5000亿飙升至3万亿,在两个月内增长了6倍[4] - 面向开发者的Flash模型经过专项优化,实现了12倍的吞吐加速[4] 智能体层:Gemini Spark - Gemini Spark是托管在Google Cloud上的个人智能体,提供7x24小时服务,支持Chat/Agent双标签页、跨端实时同步,并可通过MCP协议打通第三方工具[7] - 其定价新增AI Ultra入门档,每月100美元,最高档价格从每月250美元降至200美元[7] - 该智能体将于下半年落地Chrome浏览器成为智能体浏览器,同期推出Android Halo[7] 智能体层:Search Agents - 搜索的AI模式上线一年后月活用户突破10亿,查询量每季度翻倍,并已升级至Gemini 3.5模型[7] - 搜索框进行了25年来最大改版,原生支持文本、图像、文件、视频混合输入[7] - 推出三大新功能:1) Information Agents,可24x7后台监控股票筛选、租房等信息;2) Generative UI in Search,搜索结果直接生成交互式迷你应用;3) 通过UCP通用商业协议、AP2智能体支付协议和通用购物车,构建智能体商务完整闭环[7] - UCP协议正扩展至加拿大、澳大利亚、YouTube,并进入酒店和外卖品类,其Shopping Graph已收录600亿条商品信息[7] 性能基准数据 - 在终端编码基准测试中,Gemini 3.5 Flash得分为76.2%[8] - 在SWE-Bench Pro编码测试中,Gemini 3.5 Flash得分为55.1%[8] - 在多步工作流测试中,Gemini 3.5 Flash得分为83.6%[8] - 在金融分析测试中,Gemini 3.5 Flash得分为57.9%[8] - 在多模态理解测试中,Gemini 3.5 Flash得分为83.6%[8] - 在长上下文性能测试中,Gemini 3.5 Flash在128k上下文平均得分为77.3%[8]