Workflow
谷歌 I/O 大会:AI 从技术前沿到商业生态的验证
华泰证券·2025-05-25 21:25

证券研究报告 科技 谷歌 I/O 大会: Al 从技术前沿到商业 生态的验证 华泰研究 2025年5月25日|美国 谷歌凭借多模态和推理能力持续提升基础模型,我们重点关注支持 Veo 3 和 lmagen 4 的 Flow, 或可在内容创作者中初见商业化成效: 1)Gemini 2.5 Pro 现已支持原生音频输出,提升多模态交互效率,已嵌入多个 AI IDE 工具 (如 Cursor 等); 推出增强推理模式 Deep Think,可生成多条推理链并互相交叉 审核:2)内容生成方面,Veo 3 支持原生音频生成功能,在口型同步、现 实物理建模等方向实现突破,Imagen 4 支持 2K 分辨率及复杂材质的高保真 图像生成,二者均可通过 Flow App 使用;Gemini Diffusion 作为新一代扩散 模型,生成速度为 2.5 Flash 的 5 倍,具备并行生成及迭代修正能力;此外 还新推出实验性交互式音乐生成的 Lyria Realtime 模型,并宣布将与三星、 Gentle Monster 和 Warby Parker 合作打造智能眼镜, 也展示了两款 Android XR 的第三方设备,分别 ...