谷歌图像模型NanoBanana火爆上线,关注多模态AI应用发展
海通国际证券·2025-09-09 16:01

行业投资评级 - 评级:增持 [1] 核心观点 - 谷歌Gemini-2 5-flash-image-preview(代号Nano-Banana)模型在多模态AI领域具有创新性 其SOTA图像生成和编辑能力、强角色一致性和闪电速度 便于用户高效处理图片素材 在生产力场景和创意场景展现出超强实用性和惊人图像效果 建议关注多模态模型与应用迭代带来的发展机会 [3][9] 模型技术优势 - 具备SOTA图像生成和编辑能力 在Artificial Analysis文生图与图像编辑两个排行榜上均跃升至第一位 领先于字节即梦3 0、GPT-4o、快手可灵2 1、Qwen-Image-Edit等模型 在LMArena文生图与图像编辑两个排行榜上同样位居第一名 [3][10] - 生成每张图像成本约为0 039美元(约0 28元) 远低于OpenAI的图像生成成本(0 19美元) [3][11] - 在原生图像生成与多模态理解方面实现紧密结合 图像理解为生成提供信息 生成又反过来强化理解 背后是谷歌Gemini团队与Imagen团队的强强联合 [3][12] 功能特性 - 充分保持角色一致性 可以将同一个角色置于不同环境中 或多个角度展示同一款产品 高度还原角色面部特征、表情和姿态等 [3][11] - 基于提示的图片编辑 允许用户通过简单自然语言指令对图片进行精准局部修改 包括背景替换、风格转换、动作或手势迁移等 [3][11] - 融合Gemini的现实世界知识 借助Gemini强大世界知识库让图像生成更加智能 [3][11] - 多图像融合 可以将一张图片中的物体放进另一张图片的场景里或多个图片的拼接融合 [3][11] 应用场景与投资建议 - 在生产力场景与创意场景广泛应用 实现方便快捷的PS功能 满足生产力需求并延伸出丰富玩法 [3][11] - 建议关注标的:万兴科技(300624 SZ)、虹软科技(688088 SH)、金山办公(688111 SH)、合合信息(688615 SH)、福昕软件(688095 SH)、迈富时(2556 HK) 受益标的:当虹科技 [3][4][9]

谷歌图像模型NanoBanana火爆上线,关注多模态AI应用发展 - Reportify