谷歌 I/O 大会：AI 从技术前沿到商业生态的验证

报告行业投资评级 - 增持（维持） [6] 报告的核心观点 - 谷歌 I/O 大会对行业启示为 AI 搜索触发场景更浅层、Gemini 应用及模型覆盖率向好、生态整合力加强、商业化路径加快 [1] - 谷歌本次 I/O 大会核心是在搜索生态中让 AI 触发场景更浅层广泛，以重新夺回市场份额 [2] - 谷歌以 Gemini 为核心推进 AI 原生及 Agent 项目并融入应用生态，证明其具备从 AI 研究前沿落实到场景的工作链条 [3] - 谷歌凭借多模态和推理能力提升基础模型，支持 Veo 3 和 Imagen 4 的 Flow 或在内容创作者中初见商业化成效 [4] 根据相关目录分别进行总结 AI 搜索 - Al Mode 全面上线美国用户，支持个性化搜索结果、复杂数据可视化、购物体验整合等功能，管理层认为其将成搜索领域下一代交互范式 [1][2] - Al Overviews 覆盖 200 多个国家和地区，支持 40 多种语言，新增多种语言支持 [7] - Google Lens 年内使用次数超千亿次，同比增长 65%，引入 Search Live 可对话和读取摄像头内容 [2][7] 基础模型 - Gemini 2.5 Pro 支持原生音频输出，嵌入多个 AI IDE 工具，推出增强推理模式 Deep Think，引入 LeamLM 模型 [4][7] - Gemini 2.5 Flash Preview 在编程和复杂推理任务上表现更强，针对速度和效率优化 [7] - Veo 3 支持原生音频生成，在多方面实现突破，新增角色和摄像机控制功能，已在部分平台提供 [4][7] - Imagen 4 支持 2K 分辨率及高保真图像生成，升级版速度提升 10 倍，适配多场景，排版和文本渲染能力优化 [4][7] - Gemini Diffusion 生成速度为 2.5 Flash 的 5 倍，具备并行生成及迭代修正能力 [4][7] - Lyria RealTime 是实验性交互式音乐生成模型，可通过 Gemini API 或 Google AI Studio 使用 [7] AI Agent - Gemini Live（Project Astra）源自 Deepmind 团队，具备多种能力，将在 Android 和 iOS 全面上线，未来在无障碍应用场景扩展 [3][7] - Project Marina 是通用 Agent 交互系统，计算机使用能力已引入相关平台，预计 Q3 广泛向开发者推出，Gemini 将引入 Agent Mode，仍在试验阶段 [3][7] - Beam（Project Starline）是 AI 驱动的 3D 视频通话平台，预计今年向测试用户交付，核心技术将下沉至 Google Meet [3][7] Android XR - 谷歌与三星等合作打造智能眼镜，集成 Gemini 后具备多种功能 [4][7] - 展示两款基于 Android XR 的第三方设备，分别为三星的 Project Moohan 和 Xreal 的 Project Aura [4][7]