Workflow
接管搜索、打造全能Agent,Google用AI重建帝国
虎嗅APP·2025-05-21 19:41

Google I/O 2024核心发布 - 公司年度开发者大会以AI为核心,展示Gemini在多模态、搜索接管、AR眼镜等领域的全面突破 [4][10] - 现场通过Android XR智能眼镜的实时演示引发高潮,展示Gemini视觉记忆与物理环境交互能力 [6][7][8] - CEO Sundar Pichai强调开发节奏显著加快,模型更新频率从"年度发布"变为"随时交付" [13] Gemini技术进展 - Gemini 2.5 Pro模型Elo评分提升300+分,TPU Ironwood计算性能提升10倍达42.5 exaflops/pod [15] - 新增"深度思考模式"处理复杂问题,音频输出能力实现自然对话,视频模型Veo 3具备原生音效生成 [19][20] - 采用扩散模型加速文本生成,速度远超传统自回归模型,支持实时纠错与迭代 [40] 产品生态整合 - Gemini月活用户超4亿,Pro版本使用量增长45%,开发者数量达700万(同比5倍) [13][14] - 搜索业务全面改造:AI Mode占据首页首位,采用查询扇出技术实现多子主题并行搜索 [32] - Chrome浏览器接入Agent Mode,可同时执行10项任务,兼容主流智能体协议MCP [27] 硬件创新 - Android XR眼镜搭载Gemini Live,实现实时翻译/导航/视觉记忆,与Gentle Monster等时尚品牌合作 [7][8] - 虚拟试衣技术通过身体映射模型实现电商场景突破,支持Agent自动比价下单 [33] - 视频创作应用Flow整合Veo 3/Imagen 4模型,支持全流程视频+音效+对白生成 [37] 战略方向 - 公司确立"模型能力+通用助手+全家桶接管"三位一体战略,目标构建世界模型 [22] - Project Astra升级为Gemini Live,展示记忆强化/多任务中断恢复等AGI关键能力 [23][24] - 提出"主动型AI"理念,通过预测性服务(如旅行阅读推荐)改变交互范式 [25]