报告行业投资评级 - 科技行业评级为增持(维持)[6] 报告的核心观点 - 谷歌I/O大会对行业启示包括AI搜索触发场景更浅层、Gemini应用及模型覆盖率向好、Gemini生态整合力加强、商业化路径加快,当前建议关注AI生态免费模式下的获客能力 [1] - 本次I/O大会核心是使搜索生态中AI触发场景更浅层、广泛,以重新夺回市场份额 [2] - 谷歌以Gemini为核心推进AI原生及Agent项目并融合到已有应用生态,证明其具备从AI研究前沿落实到场景的工作链条 [3] - 谷歌凭借多模态和推理能力提升基础模型,支持Veo 3和Imagen 4的Flow或在内容创作者中初见商业化成效 [4] 根据相关目录分别进行总结 AI搜索 - AI Mode全面上线美国用户,基于Gemini 2.5定制模型,能回应复杂问询、支持连续对话,购物体验整合视觉搜索等功能,可生成结果界面,支持虚拟试穿等 [1][2][7] - AI Overviews覆盖200多个国家和地区,支持40多种语言,新增多种语言支持 [7] - Google Lens年内使用次数超千亿次,同比增长65%,引入Search Live可进行对话和读取摄像头内容 [2][7] 基础模型 - Gemini 2.5 Pro支持原生音频输出,嵌入多个AI IDE工具,推出增强推理模式Deep Think,引入LearnLM模型使其在构建学习型AI模型基准上超越对手 [4][7] - Gemini 2.5 Flash Preview更新版本在编程和复杂推理任务上表现更强,针对速度和效率优化 [7] - Veo 3支持原生音频生成功能,在多方面实现突破,新增角色输入和摄像机控制功能,已在美国Google AI Ultra订阅者的Gemini App及Vertex AI中提供 [4][7] - Imagen 4支持2K分辨率及复杂材质高保真图像生成,升级版速度较前代提升达10倍,适配多种场景,排版等能力显著优化,可在多个谷歌平台使用,与Veo 3新升级均可在Flow App中使用 [4][7] - Gemini Diffusion是新一代扩散语言模型,生成速度为2.5 Flash的5倍,具备并行生成及迭代修正能力 [4][7] - Lyria RealTime是实验性交互式音乐生成模型,可通过Gemini API或Google AI Studio使用 [7] AI Agent - Gemini Live(Project Astra)源自Deepmind团队,具备实时摄像头识别与屏幕共享能力,新增语音交互等功能,支持多语种语音风格调节,未来将在无障碍应用场景持续扩展 [3][7] - Project Marina是通用Agent交互系统,计算机使用能力可对浏览器、App进行操作控制,其相关能力已引入Gemini API和Vertex AI,已有多家公司使用,预计Q3广泛向开发者推出,Gemini将基于此引入Agent Mode,目前仍在试验阶段 [3][7] - Beam(Project Starline)是AI驱动的3D视频通话平台,利用6机位视频阵列与AI融合建模,预计今年内向测试用户交付,核心技术将下沉至Google Meet,首批语音翻译功能已上线,年内将扩展至更多语言 [3][7] Android XR - 谷歌与三星等合作打造智能眼镜,集成Gemini后具备实时导航等功能 [4][7] - 展示两款基于Android XR的第三方设备,分别为三星的Project Moohan和Xreal的Project Aura [4][7]
谷歌I/O大会:AI从技术前沿到商业生态的验证
华泰证券·2025-05-25 19:32