谷歌I/O炸场:Agent时代正式开打,OpenAI最大对手回来了
创业邦·2026-05-20 11:34

文章核心观点 - 谷歌在I/O 2026大会上宣布AI Agent时代进入规模化落地阶段,其战略核心是将Gemini从一个应用转变为所有产品入口背后的操作系统,并重新定义为能够持续执行任务、拥有状态记忆和跨应用协作能力的智能体[4][10] - 行业竞争焦点已从追求模型“最聪明”转向“运营竞赛”,即比拼成本、速度、稳定性和规模化部署能力,谷歌通过推出成本优化模型、多Agent协作平台和嵌入全生态入口来应对这一转变[31][32] 根据相关目录分别进行总结 Agent战略与产品化 - 谷歌推出核心新产品Gemini Spark,定位为“全天候数字分身”,可7×24小时在后台自动执行复杂任务,如汇总邮件、统计信息、生成内容等,标志着AI从问答工具向长期运行执行系统的转变[6][8][10] - 公司为Android系统新增了Agent入口“Android Halo”,用于实时显示AI任务执行状态,进一步强化了AI作为“数字员工”的角色[10] 成本优化与模型竞争 - 为应对Agent应用带来的高额计算成本,谷歌推出了专门针对Agent工作流优化的Gemini 3.5 Flash模型,其目标是成为“最适合跑Agent”的模型[11] - 该模型性能接近顶级前沿模型,输出速度是其他模型的四倍,在特定平台上甚至快12倍,而成本仅为同类模型的一半或更低[13] - 谷歌CEO皮查伊算了一笔账:若头部企业将80%的工作负载从其他前沿模型迁移至Gemini 3.5 Flash,每年可节省超过100亿美元[13] - 目前谷歌自家产品每月处理的Token已达3200万亿个,同比增长7倍,内部开发任务每日消耗超过3万亿Token[11] 多Agent协作与开发平台 - 谷歌将AI编程工具Antigravity升级为多Agent协作平台Antigravity 2.0,开发者可调度多个Agent并行完成写代码、设计、测试等任务[14][16] - 现场演示了93个Agent并行协作,在12小时内处理260亿Token,从零构建出一个可运行的操作系统(包括运行游戏Doom),总API成本低于1000美元[16] 搜索业务的重塑 - 谷歌对搜索进行了25年来最大升级,使其从提供链接答案转变为“生成执行结果”,例如直接生成交互式可视化界面来回答复杂问题[18] - 搜索将整合Information Agent功能,允许用户创建后台持续监控特定信息(如股票、价格、行业动态)的智能体,使搜索从一次性查询变为持续性任务[18] 多模态与“世界模型”进展 - 谷歌推出原生多模态模型Gemini Omni,旨在实现“从任何输入,生成任何输出”,能够混合处理文本、图片、音频、视频并生成相应输出[20][22] - 演示显示,用户可在一个连续对话中完成对视频的背景替换、镜头视角更改及添加旁白等复杂编辑,标志着视频生成从“生成片段”向“持续编辑世界”升级[22] 生态系统与入口优势 - 谷歌最强大的竞争优势在于其庞大的产品生态系统(搜索、Chrome、Android、YouTube、Gmail、Maps、Workspace),这些入口构成了全球最大的互联网流量系统之一[24] - 公司正将Gemini嵌入所有入口,意味着其可直接向数十亿现有用户分发AI Agent,而竞争对手仍需解决用户获取问题[24][26] - 公司通过Android XR智能眼镜等新硬件,让Gemini成为未来所有设备背后的默认智能层,进一步扩展其入口覆盖[26][29] 行业基础设施与资本投入 - AI行业进入“运营竞赛”阶段,胜负关键取决于基础设施的稳定性、成本、Token效率和规模化能力,而不仅仅是模型智商[31][32] - 谷歌2026年资本支出预计高达1800亿至1900亿美元,并推出专门区分训练与推理的第八代TPU芯片,旨在将最强AI变为最便宜的AI[32][33]

谷歌I/O炸场:Agent时代正式开打,OpenAI最大对手回来了 - Reportify