Gen系列模型 - 财报，业绩电话会，研报，新闻

Gen系列模型

搜索文档

华安证券· 2025-07-15 16:18

报告行业投资评级 - 行业评级为增持 [1] 报告的核心观点 - 生成式AI模型开源闭源并行发展，模型版本持续迭代，AI驱动的创新落地成竞争点 [3] - 生成式AI在影视行业全链路布局，多维度提升影视质量，但算力资源和一致性是主要限制因素 [4] - 生成式AI助力游戏内容生成，赋能游戏内交互场景 [5] - 生成式AI未来在影视领域会在精度、质量和时长三个维度创新迭代 [6] - 国内生成式AI行业各领域厂商均有布局，建议关注相关公司 [9] 根据相关目录分别进行总结 1 AI视频及图像生成模型未来展望 1.1 AI视频图像模型技术发展趋势 - 2024年11月至今，国内外AI视频图像模型不断迭代，分闭源和开源模型，海外和国内已发布多款新版本 [19] - 未来技术发展聚焦3D生成模型、多模态融合、参数性能提升 [20] - 3D生成模型未来或成重要竞争领域，推动多领域3D建模自动化，今年众多厂商发布相关模型 [25] 1.2 AI视频图像模型未来应用场景展望 - 游戏领域，AI陪伴成主流应用场景，如《Whispers from the Star》和《EVE》 [36] - “AI+影视动画”合作成果初现，上海电影和即梦AI发起活动，探索全链条创新应用 [39] - AI图像及视频生成赋能广告营销领域，创意营销引领潮流，如天猫、康师傅等案例 [43] - “AI+设计”探索新质生产力，AI建筑设计、品牌包装设计方兴未艾，如中南建筑设计院和Lovart [48] 2 Runway 2.1 Gen系列模型迭代更新，内容生成技术不断精进 - 2023年2月至2025年4月，Runway发布Gen-1、Gen-2、Gen-3 Alpha、Gen-4和Gen-4 Turbo模型，功能不断提升 [51] 2.2 Gen系列模型应用场景案例及核心技术 - Gen-1依赖文本或参考图像转化视频，Gen-2在其基础上增加多项功能，Gen-3 Alpha提升视频表现，Gen-4维护连贯环境，Gen-4 Turbo优化速度 [56][58][87][90] 2.3 Runway产品价格模式 - C端用户积分订阅制，年度订阅享20%折扣，不同付费计划对生成视频条件有限制 [94] - B端用户根据企业情况提供对应AI解决方案，分自助服务和全方位服务 [94] 3 可灵AI 3.1 可灵AI B端C端同步发展 - 可灵AI经历多次版本迭代，在视频时长、质量、物理规律真实性上优化 [99] - 可灵AI在B端与C端同步发展，C端为用户提供创作生产力，降低成本，带动付费增长；B端与数千家客户合作，提供API接口 [102][103] 3.2 可灵AI商业化模式及运营数据 - 可灵AI采用会员制和资源包付费，2025年5月，Web端全球访问量和APP端下载量有数据体现 [115][120] - ConceptMaster是多主体视频生成技术方案，支持多概念定制视频等功能 [123] 3.3 近期更新 - 4月15日，推出可图2.0和可灵2.0，在语义响应、动态质量、画面美学升级，基于MVL推出多模态编辑功能 [125] - 5月29日，推出可灵2.1系列模型，性价比和生成效率提升，生成质量全面提升 [128] 4 即梦AI 4.1 即梦AI模型版本迭代、核心功能及技术 - 即梦AI多次迭代，各版本有不同核心功能突破，底层技术包括深度学习模型、GAN、VAE [130][131] 4.2 即梦AI模型应用场景、生成效果及同行业产品对比 - 即梦AI领先应用场景包括文本生成图片视频、文本渲染、超现实主义肖像等，与其他模型有效果图对比 [134] 4.3 即梦AI产品价格模式 - 即梦AI采用积分订阅制和直接购买积分制，不同会员等级有不同价格和积分 [156] 5 Midjourney 5.1 Midjourney版本迭代、优化情况及效果图比较 - 2022年2月至2025年4月，Midjourney多个版本迭代，图像质量和功能不断提升 [160] 5.2 Midjourney核心技术及应用场景 - 核心技术为GAN和优化的变换器架构，V7模型有核心亮点，应用场景广泛 [163][164] 5.3 Midjourney产品价格模式 - 采用订阅制收费，不同付费计划在GPU时间、隐身模式等方面有不同服务 [173] 6 Stable Diffusion 6.1 Stable Diffusion版本迭代与变体及核心功能 - 2022年8月发布，多次版本迭代和变体更新，针对不同用户有多层次功能，基于多种核心技术实现 [178][181] 6.2 Stable Diffusion核心技术及应用场景 - 工作流程含CLIP、Diffusion、VAE模型，应用场景包括电商运营、设计等 [184] 6.3 Stable Diffusion产品价格模式 - B端采用API订阅制，C端采用积分订阅制，不同等级有不同价格和权益 [203] 7 豆包 7.1 豆包大模型关键更新迭代、主要功能变化 - 2023年8月至2025年5月，豆包模型层和产品层不断更新迭代，提升多方面能力 [205][207] 7.2 豆包大模型核心技术及应用场景 - 依托深度学习架构，采用Transformer等技术，有九类模型，应用场景广泛 [210] 7.3 豆包视觉理解模型、图片及视频生成模型产品价格模式 - 视觉理解模型按token计费，视频生成模型按token用量付费，图片生成模型按张数付费 [214][216] 8 海艺AI - SeaArt AI 8.1 SeaArt AI版本迭代、核心技术及合作情况 - 2023年6月发布，自研大模型经历三次迭代，与多方合作寻求技术突破 [221] 8.2 SeaArt AI用户分层及应用场景 - 版本迭代实现用户分层，落地页降低上手门槛，ComfyUI服务核心AI用户并筛选高阶用户，在游戏行业有应用优势 [227][231] 8.3 SeaArt AI产品价格模式 - 采用订阅制和算力充值收费两种模式，不同等级有不同价格和权益 [235] 9 LiblibAI 9.1 LiblibAI概况、融资情况及核心功能 - 2023年5月成立，已完成四轮融资，提供多种AI创作方式，构建AI内容创作分享及版权生态链 [241][242] 9.2 LiblibAI x星流Star - 3 Alpha大模型功能及应用场景 - Star - 3 Alpha大模型提供精准细腻图像生成能力，功能特性强大，应用场景广泛 [245][246] 9.3 全球第一款专业设计AI Agent：Lovart - 2025年5月12日发布，功能、技术层面有特点，应用场景包括品牌设计等 [267][271] 9.4 LiblibAI产品价格模式 - B端采用解决方案制和团队版会员订阅计划，C端采用会员订阅制，不同等级有不同价格和权益 [276] 10 美图AI Agent RoboNeo - 美图发布RoboNeo，定位图像设计AI Agent，有主要功能和应用场景，未来有广泛商业应用价值 [279][282][283] 11 投资建议 11.1 影视行业应用 - AI图片/视频生成在影视行业落地，多模态模型有商业化潜力，未来提升方向在精度、质量和时长 [290][291] - 多模态模型更多应用于影视作品，头部影视公司和短视频/短剧相关公司积极布局 [294][298] 11.2 游戏行业应用 - 生成式AI可从多方面进行游戏画面及场景生成，在内容生成和交互层面发挥作用，应用集中在研发降本增效和扩充交互模式 [299][300] 11.3 相关公司 - 腾讯在游戏和视频领域持续布局，赋能内容生成，业绩良好 [301][304] - 阿里巴巴在视频生成领域布局，模型能力强，业绩增长 [305] - 快手可灵大模型迭代，业绩提升，可灵AI营收增长势头强劲 [306] - 还可关注字节豆包大模型、即梦AI，海外Runway、Midjourney和Stable Diffusion [307]