行业投资评级 - 看好丨维持 [7] 核心观点 - 供需共振叠加政策落地强化国内Agent投资核心逻辑 预计Q4国内模型与应用侧迎来核心拐点 强烈看好国内AI应用货币化开启、规模化、商业化提速 垂直场景Agent落地周期有望提前 [2][8] - 谷歌Gemini 2.5 Flash Image模型的高性能与低成本优势有望加速多模态AI应用落地 引领交互范式革命 [5][8] 事件描述 - 2025年8月26日谷歌发布图像生成与编辑模型Gemini 2.5 Flash Image Preview 代号"Nano-Banana" 支持32k上下文 [2][5] - 文本输入/输出定价分别为0.3美元/2.5美元 图像输入/输出定价分别为0.3美元/30美元 [2][5] 技术能力 - 在LMArena基准测试中表现优异 角色一致性、创意、图表、事物/环境方面优势明显 风格化稍逊于GPT-4o [8] - 具备五大核心功能:文生图、图文生图、多图生图、迭代细化、高保真文本渲染 [8] - 实现交错生成(Interleaved Generation)机制 能在统一上下文中分阶段按指令生成图片 保证系列作品一致性与差异性 [8] - 突破文字渲染能力 可作为反映全局性能的关键代理指标 [8] - 支持像素级精准编辑(Pixel perfect editing) 用户可通过调整prompt快速重新运行直至满意 [8] 应用价值 - 创作方式从生产力工具延伸向创意工具 实现从效率工具到创意伙伴的转变 [8] - 具备出色的角色一致性、自然语言和空间理解能力 支持多参考元素迁移组合及任意风格迁移复制 [8] - 生成单张图像成本约0.039美元 低于GPT-Image-1的0.19美元 [8] - 高质量低成本生成、多轮对话编辑、生成速度提升三者合一引领交互范式革命 从"编写精确指令"转向"进行自然对话"的共创协作模式 [8] 投资建议 - 关注AI Agent相关厂商、中国推理算力产业链、云服务厂商、IDC(重点关注与阿里巴巴等大厂合作的IDC) [8] - 预计Q4国内模型与应用侧迎来核心拐点 垂直场景Agent落地周期提前 [2][8]
AI产业跟踪:谷歌发布新图像模型Gemini2.5FlashImage,关注多模态AI应用落地进展