Workflow
谷歌 I/O 大会:AI 从技术前沿到商业生态的验证
华泰证券·2025-05-25 21:25

报告行业投资评级 - 增持(维持) [6] 报告的核心观点 - 谷歌 I/O 大会对行业启示为 AI 搜索触发场景更浅层、Gemini 应用及模型覆盖率向好、生态整合力加强、商业化路径加快 [1] - 谷歌本次 I/O 大会核心是在搜索生态中让 AI 触发场景更浅层广泛,以重新夺回市场份额 [2] - 谷歌以 Gemini 为核心推进 AI 原生及 Agent 项目并融入应用生态,证明其具备从 AI 研究前沿落实到场景的工作链条 [3] - 谷歌凭借多模态和推理能力提升基础模型,支持 Veo 3 和 Imagen 4 的 Flow 或在内容创作者中初见商业化成效 [4] 根据相关目录分别进行总结 AI 搜索 - Al Mode 全面上线美国用户,支持个性化搜索结果、复杂数据可视化、购物体验整合等功能,管理层认为其将成搜索领域下一代交互范式 [1][2] - Al Overviews 覆盖 200 多个国家和地区,支持 40 多种语言,新增多种语言支持 [7] - Google Lens 年内使用次数超千亿次,同比增长 65%,引入 Search Live 可对话和读取摄像头内容 [2][7] 基础模型 - Gemini 2.5 Pro 支持原生音频输出,嵌入多个 AI IDE 工具,推出增强推理模式 Deep Think,引入 LeamLM 模型 [4][7] - Gemini 2.5 Flash Preview 在编程和复杂推理任务上表现更强,针对速度和效率优化 [7] - Veo 3 支持原生音频生成,在多方面实现突破,新增角色和摄像机控制功能,已在部分平台提供 [4][7] - Imagen 4 支持 2K 分辨率及高保真图像生成,升级版速度提升 10 倍,适配多场景,排版和文本渲染能力优化 [4][7] - Gemini Diffusion 生成速度为 2.5 Flash 的 5 倍,具备并行生成及迭代修正能力 [4][7] - Lyria RealTime 是实验性交互式音乐生成模型,可通过 Gemini API 或 Google AI Studio 使用 [7] AI Agent - Gemini Live(Project Astra)源自 Deepmind 团队,具备多种能力,将在 Android 和 iOS 全面上线,未来在无障碍应用场景扩展 [3][7] - Project Marina 是通用 Agent 交互系统,计算机使用能力已引入相关平台,预计 Q3 广泛向开发者推出,Gemini 将引入 Agent Mode,仍在试验阶段 [3][7] - Beam(Project Starline)是 AI 驱动的 3D 视频通话平台,预计今年向测试用户交付,核心技术将下沉至 Google Meet [3][7] Android XR - 谷歌与三星等合作打造智能眼镜,集成 Gemini 后具备多种功能 [4][7] - 展示两款基于 Android XR 的第三方设备,分别为三星的 Project Moohan 和 Xreal 的 Project Aura [4][7]