报告行业投资评级 - 传媒行业评级:强大于市(维持)[2] 报告核心观点 - 技术跃迁驱动内容革命,AI视频生成正从GAN走向DiT架构,是通往AGI的重要路径,其突破将对AIGC产业应用前景起到重要作用[3] - 短视频生成质量已接近专业水准,但长视频生成在物理合理性与时长上仍存瓶颈,业界关注的世界模型可能成为解决上述瓶颈、带来新技术变革的关键路径[3] - 全球AI视频生成市场正加速扩张,商业化在C端(订阅模式)与B端(API模式)双路并进,随着模型能力与工具链完善,2026年有望成为AI影视级项目商业化的关键元年[3] - AI视频是传媒行业的核心应用场景,广告、影视、游戏等领域均有望受益,并已涌现出具备自研算法、海量内容、AI营销及游戏资产生产能力的核心受益上市公司[4] 根据目录的总结 1. 视频生成的前世今生:从GAN走向DiT,通往AGI的重要路径 - 视频生成决定AIGC技术上限:视频融合文本、图像、音频等多模态信息并引入时间维度,需处理空间、时间、因果与交互等高维结构,其复杂性要求模型具备对真实世界的综合理解与推演能力,是当前行业技术短板[7] - 技术路径演进形成共识:AI视频生成技术自2010年代中后期起步,经历了GAN、Transformer、Diffusion Model等多个架构尝试。2024年OpenAI发布的Sora验证了DiT(Diffusion+Transformer)架构的可行性与效果,推动主流厂商全面向DiT路径演进,产业进入高速发展期[3][9] - DiT架构成为主导路线:DiT融合了扩散模型的生成稳定性与Transformer的长程依赖建模能力,遵循Scaling Law,使生成能力可随参数规模、数据体量与训练算力提升而持续增强。Sora发布后,字节、Google、腾讯等主流厂商模型均已向DiT架构收敛[25][29][30] 2. 技术进展:短视频生成已近专业水准,长视频或迎重要变革节点 - 美学质量接近专业水准:当前主流模型已支持1080p及以上分辨率(部分达4K),帧率多为24-30fps。以Sora 2为例,其在高真实性、多风格表达、复杂人物主体及多镜头连续叙事方面表现成熟,短片段生成能力已基本满足影视与商业内容制作需求[34][36] - 多模态向“音画一体”演进:AI视频音效生成分为一体化生成和后期分离生成两类路径。Google Veo 3是首个实现商业化落地的音视同步生成模型,在发布后两个月内累计生成视频超过7,000万条。在其示范效应下,主流厂商发布节奏密集,技术路径趋于收敛[41][46][47] - 物理能力与生成长时是主要瓶颈:提升物理能力主要有“隐式物理学习”(迭代快但稳定性有限)和“显式物理约束”(物理正确性高但成本与自由度受限)两种路径[50][57]。目前主流视频模型的单次原生生成时长普遍在5-20秒,长视频生成受模型上下文记忆力有限及误差累积两大技术限制[61][62] - 世界模型或为长视频带来新变量:世界模型旨在构建可长期维持状态并遵循物理规律的虚拟世界,正对应视频生成在长时一致性与物理可信度上的短板。2025年后,产业研究重心向“生成派”倾斜,如Google的Genie 3已能实时生成维持数分钟画面一致性的动态世界。世界模型在关键性能上迭代更快,可能成为视频生成的另一条主流演进路径[3][72][82][90] 3. 商业化进展:C+B端双路并进,影视级项目有望迎来商业元年 - 市场规模与增长:全球AI视频生成市场正加速扩张,预计2026年市场规模将达2.96亿美元,同比增长35.16%[3] - C端以订阅模式为主:用户量是现阶段主要评判标准,Sora体量断档领先。行业正探索新商业模式,如OpenAI推出社交化视频创作平台Sora app,未来有望向广告、电商等路径拓展[3] - B端以API模式为主:核心在电商展示、广告等领域应用已基本成熟,“质量+效率+成本”是核心评价维度,可灵、海螺、Vidu等部分国产模型已实现行业领先。目前API模式主要应用于素材级生成[3] - 影视级项目商业化起步:部分海外厂商已开始试水影视级AI解决方案并实现商业验证。例如,Utopai通过《Cortés》《Project Space》等项目累计实现收入约1.1亿美元。随着模型能力演进与工具链完善,2026年有望成为AI影视制作商业化的关键起点[3] 4. 传媒:AI视频核心应用场景,广告、影视、游戏均有望受益 - 广告:视频素材占比高,AI渗透潜力大:2025年上半年全网移动广告中,视频类素材投放占比已超过65%,其中竖屏视频占比高达54.8%,契合现阶段视频生成模型能力边界。目前AI在广告内容生成中,视频创作渗透率(19%)明显低于内容草拟(70%)和文案创作(59%),具备后发增长潜力。AI视频工具有望使营销服务商转型为全链路合作伙伴[4] - 影视:AI漫剧与短剧率先实现商业闭环:AI漫剧与视频生成契合度最高,已率先实现商业闭环。拟真人短剧方面,2025年1月抖音TOP5000短剧中仅4部为全AI生成,10月、11月分别增长至69部与217部,内容接受度快速提升。长剧与电影层面,CG特效等高价值环节有望成为首批替代场景,中小型影视团队或更可能率先受益[4] - 游戏:技术同源,应用持续深化:视频生成与3D生成的底层技术路径一致。当前3D生成在游戏建模领域已初步实现静态资产的自动化生产,例如腾讯内部数十款游戏(如《元梦之星》)已接入混元3D能力。后续世界模型等新技术落地有望进一步带动动态资产生成与应用,视频生成与交互融合亦可能催生具备实时互动能力的新游戏品类[4] 5. 核心受益上市公司 - 具备自研算法与模型能力的技术型公司:昆仑万维[4] - 拥有海量内容资产与版权资源的影视内容提供商:中文在线、捷成股份、华策影视[4] - 积极布局AI营销、具备内容分发的整合型平台公司:易点天下[4] - 推动AI生成能力嵌入游戏资产生产流程的大型游戏公司:完美世界、巨人网络[4]
AI视频行业深度报告:技术跃迁驱动内容革命,把握产业变革新机遇