Gen系列模型

搜索文档
AI系列专题跟踪:视频及图像生成模型
华安证券· 2025-07-15 16:18
报告行业投资评级 - 行业评级为增持 [1] 报告的核心观点 - 生成式AI模型开源闭源并行发展,模型版本持续迭代,AI驱动的创新落地成竞争点 [3] - 生成式AI在影视行业全链路布局,多维度提升影视质量,但算力资源和一致性是主要限制因素 [4] - 生成式AI助力游戏内容生成,赋能游戏内交互场景 [5] - 生成式AI未来在影视领域会在精度、质量和时长三个维度创新迭代 [6] - 国内生成式AI行业各领域厂商均有布局,建议关注相关公司 [9] 根据相关目录分别进行总结 1 AI视频及图像生成模型未来展望 1.1 AI视频图像模型技术发展趋势 - 2024年11月至今,国内外AI视频图像模型不断迭代,分闭源和开源模型,海外和国内已发布多款新版本 [19] - 未来技术发展聚焦3D生成模型、多模态融合、参数性能提升 [20] - 3D生成模型未来或成重要竞争领域,推动多领域3D建模自动化,今年众多厂商发布相关模型 [25] 1.2 AI视频图像模型未来应用场景展望 - 游戏领域,AI陪伴成主流应用场景,如《Whispers from the Star》和《EVE》 [36] - “AI+影视动画”合作成果初现,上海电影和即梦AI发起活动,探索全链条创新应用 [39] - AI图像及视频生成赋能广告营销领域,创意营销引领潮流,如天猫、康师傅等案例 [43] - “AI+设计”探索新质生产力,AI建筑设计、品牌包装设计方兴未艾,如中南建筑设计院和Lovart [48] 2 Runway 2.1 Gen系列模型迭代更新,内容生成技术不断精进 - 2023年2月至2025年4月,Runway发布Gen-1、Gen-2、Gen-3 Alpha、Gen-4和Gen-4 Turbo模型,功能不断提升 [51] 2.2 Gen系列模型应用场景案例及核心技术 - Gen-1依赖文本或参考图像转化视频,Gen-2在其基础上增加多项功能,Gen-3 Alpha提升视频表现,Gen-4维护连贯环境,Gen-4 Turbo优化速度 [56][58][87][90] 2.3 Runway产品价格模式 - C端用户积分订阅制,年度订阅享20%折扣,不同付费计划对生成视频条件有限制 [94] - B端用户根据企业情况提供对应AI解决方案,分自助服务和全方位服务 [94] 3 可灵AI 3.1 可灵AI B端C端同步发展 - 可灵AI经历多次版本迭代,在视频时长、质量、物理规律真实性上优化 [99] - 可灵AI在B端与C端同步发展,C端为用户提供创作生产力,降低成本,带动付费增长;B端与数千家客户合作,提供API接口 [102][103] 3.2 可灵AI商业化模式及运营数据 - 可灵AI采用会员制和资源包付费,2025年5月,Web端全球访问量和APP端下载量有数据体现 [115][120] - ConceptMaster是多主体视频生成技术方案,支持多概念定制视频等功能 [123] 3.3 近期更新 - 4月15日,推出可图2.0和可灵2.0,在语义响应、动态质量、画面美学升级,基于MVL推出多模态编辑功能 [125] - 5月29日,推出可灵2.1系列模型,性价比和生成效率提升,生成质量全面提升 [128] 4 即梦AI 4.1 即梦AI模型版本迭代、核心功能及技术 - 即梦AI多次迭代,各版本有不同核心功能突破,底层技术包括深度学习模型、GAN、VAE [130][131] 4.2 即梦AI模型应用场景、生成效果及同行业产品对比 - 即梦AI领先应用场景包括文本生成图片视频、文本渲染、超现实主义肖像等,与其他模型有效果图对比 [134] 4.3 即梦AI产品价格模式 - 即梦AI采用积分订阅制和直接购买积分制,不同会员等级有不同价格和积分 [156] 5 Midjourney 5.1 Midjourney版本迭代、优化情况及效果图比较 - 2022年2月至2025年4月,Midjourney多个版本迭代,图像质量和功能不断提升 [160] 5.2 Midjourney核心技术及应用场景 - 核心技术为GAN和优化的变换器架构,V7模型有核心亮点,应用场景广泛 [163][164] 5.3 Midjourney产品价格模式 - 采用订阅制收费,不同付费计划在GPU时间、隐身模式等方面有不同服务 [173] 6 Stable Diffusion 6.1 Stable Diffusion版本迭代与变体及核心功能 - 2022年8月发布,多次版本迭代和变体更新,针对不同用户有多层次功能,基于多种核心技术实现 [178][181] 6.2 Stable Diffusion核心技术及应用场景 - 工作流程含CLIP、Diffusion、VAE模型,应用场景包括电商运营、设计等 [184] 6.3 Stable Diffusion产品价格模式 - B端采用API订阅制,C端采用积分订阅制,不同等级有不同价格和权益 [203] 7 豆包 7.1 豆包大模型关键更新迭代、主要功能变化 - 2023年8月至2025年5月,豆包模型层和产品层不断更新迭代,提升多方面能力 [205][207] 7.2 豆包大模型核心技术及应用场景 - 依托深度学习架构,采用Transformer等技术,有九类模型,应用场景广泛 [210] 7.3 豆包视觉理解模型、图片及视频生成模型产品价格模式 - 视觉理解模型按token计费,视频生成模型按token用量付费,图片生成模型按张数付费 [214][216] 8 海艺AI - SeaArt AI 8.1 SeaArt AI版本迭代、核心技术及合作情况 - 2023年6月发布,自研大模型经历三次迭代,与多方合作寻求技术突破 [221] 8.2 SeaArt AI用户分层及应用场景 - 版本迭代实现用户分层,落地页降低上手门槛,ComfyUI服务核心AI用户并筛选高阶用户,在游戏行业有应用优势 [227][231] 8.3 SeaArt AI产品价格模式 - 采用订阅制和算力充值收费两种模式,不同等级有不同价格和权益 [235] 9 LiblibAI 9.1 LiblibAI概况、融资情况及核心功能 - 2023年5月成立,已完成四轮融资,提供多种AI创作方式,构建AI内容创作分享及版权生态链 [241][242] 9.2 LiblibAI x星流Star - 3 Alpha大模型功能及应用场景 - Star - 3 Alpha大模型提供精准细腻图像生成能力,功能特性强大,应用场景广泛 [245][246] 9.3 全球第一款专业设计AI Agent:Lovart - 2025年5月12日发布,功能、技术层面有特点,应用场景包括品牌设计等 [267][271] 9.4 LiblibAI产品价格模式 - B端采用解决方案制和团队版会员订阅计划,C端采用会员订阅制,不同等级有不同价格和权益 [276] 10 美图AI Agent RoboNeo - 美图发布RoboNeo,定位图像设计AI Agent,有主要功能和应用场景,未来有广泛商业应用价值 [279][282][283] 11 投资建议 11.1 影视行业应用 - AI图片/视频生成在影视行业落地,多模态模型有商业化潜力,未来提升方向在精度、质量和时长 [290][291] - 多模态模型更多应用于影视作品,头部影视公司和短视频/短剧相关公司积极布局 [294][298] 11.2 游戏行业应用 - 生成式AI可从多方面进行游戏画面及场景生成,在内容生成和交互层面发挥作用,应用集中在研发降本增效和扩充交互模式 [299][300] 11.3 相关公司 - 腾讯在游戏和视频领域持续布局,赋能内容生成,业绩良好 [301][304] - 阿里巴巴在视频生成领域布局,模型能力强,业绩增长 [305] - 快手可灵大模型迭代,业绩提升,可灵AI营收增长势头强劲 [306] - 还可关注字节豆包大模型、即梦AI,海外Runway、Midjourney和Stable Diffusion [307]