谷歌I/O大会：AI从技术前沿到商业生态的验证

报告行业投资评级 - 科技行业评级为增持（维持）[6] 报告的核心观点 - 谷歌I/O大会对行业启示包括AI搜索触发场景更浅层、Gemini应用及模型覆盖率向好、Gemini生态整合力加强、商业化路径加快，当前建议关注AI生态免费模式下的获客能力 [1] - 本次I/O大会核心是使搜索生态中AI触发场景更浅层、广泛，以重新夺回市场份额 [2] - 谷歌以Gemini为核心推进AI原生及Agent项目并融合到已有应用生态，证明其具备从AI研究前沿落实到场景的工作链条 [3] - 谷歌凭借多模态和推理能力提升基础模型，支持Veo 3和Imagen 4的Flow或在内容创作者中初见商业化成效 [4] 根据相关目录分别进行总结 AI搜索 - AI Mode全面上线美国用户，基于Gemini 2.5定制模型，能回应复杂问询、支持连续对话，购物体验整合视觉搜索等功能，可生成结果界面，支持虚拟试穿等 [1][2][7] - AI Overviews覆盖200多个国家和地区，支持40多种语言，新增多种语言支持 [7] - Google Lens年内使用次数超千亿次，同比增长65%，引入Search Live可进行对话和读取摄像头内容 [2][7] 基础模型 - Gemini 2.5 Pro支持原生音频输出，嵌入多个AI IDE工具，推出增强推理模式Deep Think，引入LearnLM模型使其在构建学习型AI模型基准上超越对手 [4][7] - Gemini 2.5 Flash Preview更新版本在编程和复杂推理任务上表现更强，针对速度和效率优化 [7] - Veo 3支持原生音频生成功能，在多方面实现突破，新增角色输入和摄像机控制功能，已在美国Google AI Ultra订阅者的Gemini App及Vertex AI中提供 [4][7] - Imagen 4支持2K分辨率及复杂材质高保真图像生成，升级版速度较前代提升达10倍，适配多种场景，排版等能力显著优化，可在多个谷歌平台使用，与Veo 3新升级均可在Flow App中使用 [4][7] - Gemini Diffusion是新一代扩散语言模型，生成速度为2.5 Flash的5倍，具备并行生成及迭代修正能力 [4][7] - Lyria RealTime是实验性交互式音乐生成模型，可通过Gemini API或Google AI Studio使用 [7] AI Agent - Gemini Live（Project Astra）源自Deepmind团队，具备实时摄像头识别与屏幕共享能力，新增语音交互等功能，支持多语种语音风格调节，未来将在无障碍应用场景持续扩展 [3][7] - Project Marina是通用Agent交互系统，计算机使用能力可对浏览器、App进行操作控制，其相关能力已引入Gemini API和Vertex AI，已有多家公司使用，预计Q3广泛向开发者推出，Gemini将基于此引入Agent Mode，目前仍在试验阶段 [3][7] - Beam（Project Starline）是AI驱动的3D视频通话平台，利用6机位视频阵列与AI融合建模，预计今年内向测试用户交付，核心技术将下沉至Google Meet，首批语音翻译功能已上线，年内将扩展至更多语言 [3][7] Android XR - 谷歌与三星等合作打造智能眼镜，集成Gemini后具备实时导航等功能 [4][7] - 展示两款基于Android XR的第三方设备，分别为三星的Project Moohan和Xreal的Project Aura [4][7]