行业与公司分析:AI视频生成行业电话会议纪要 一、 行业概况与核心趋势 * 行业定位:AI视频生成行业,主要应用于短剧、商业广告、普通短视频制作 [1] * 发展阶段:2026年被视作AI视频爆发元年,行业处于加速期,尚未看到增速边际放缓的迹象 [1][33] * 核心驱动:模型能力从“创作者迁就模型”转向“模型迁就创作者”,显著降低使用门槛,释放非专业用户生产力 [1][34][35] * 技术平权效应:技术门槛降低导致参与者增多,加剧行业竞争,压低市场价格 [29][31] * 海内外对比:海内外模型能力差异不大,国内模型在体验层面(以即梦2.0为代表)甚至略有领先 [37] 二、 市场渗透与商业应用 * 渗透率水平:AI在短剧制作中渗透率最高,达60%-70%;广告行业次之,约30%-40%;普通短视频领域渗透率约30%到40% [1][28][39] * 商业场景: * 短剧:AI短剧热度高,吸引大量传统影视从业者进入 [28] * 商业广告:行业对AI接受度相对较低,仍存在“必须实拍”的认知惯性 [28] * 普通短视频:覆盖范围广(虚拟数字人、信息流广告等),AI提升空间大,尚未出现绝对头部企业 [39][40] * 盈利能力:在影视精品化路线下,通过承接广告、宣传片、定制项目等订单,可以实现盈利 [26] * 商业模式:对外报价较高,例如接近TVC级别的广告项目报价为300–800元/秒 [27] 三、 主要AI模型竞争格局与性能对比 * 图像生成模型:使用频率最高、质量稳定的主要是nano banana pro、即梦、Midjourney [3] * 视频生成模型:常用模型包括奇梦、可灵、海螺、微度、V3、Sora 2等 [3] * 模型性能对比: * 即梦2.0 (CDA2.0):性价比最高(约4元/5秒),易用性最强,“全能参考”能力实现质变,支持主体一致性与运镜领先 [1][5][17] * 可灵:在商业级稳定性(逐帧不形变)上领先,画质表现好,在商业广告场景综合表现定义为100分,其他模型约为其70%到80% [1][9][10] * V3.1等海外模型:生成效果较强,但因高溢价(价格贵50%)导致渗透受限 [1][6][7] * Sora 2:价格低,但稳定性不足,多用于“视频预跑”作为参考工具,不直接用于最终成片 [8] * 海螺:在人物动作表演力(如打斗)方面更强,但自带风格可能影响画面一致性,价格约6元多/5秒 [17][25] * 关键能力进展: * 音画同步:可灵2.6(2025年12月底上线)、微度Q3(2026年1月中下旬)、即梦2.0相继上线该功能,极大提升效率 [1][4][20] * “全能参考”:即梦2.0在参考能力上突出,对输入条件保留更完整,丢失程度更低 [5] * 易用性:即梦2.0提示词响应能力显著增强,上手难度明显下降,是其破圈关键 [34][35][36] 四、 应用场景与模型选择策略 * 商业广告: * 对画质、细节稳定性要求极高,需逐帧审查(如每0.5秒截取一帧) [10] * 图像生成首选Banana生图至4K+;视频生成首选可灵,核心考虑其高帧数与画质 [3] * 短剧: * 对人物表现力、音画同步要求高 [4] * 人物对话等关键环节首选可灵2.6或微度Q3,因其能节省人效并提升成片率 [4] * 非关键片段使用微度、奇梦、拍我等模型 [4] * 普通短视频: * 更关注画面丰富度、镜头语言与性价比 [3] * 图像生成常用奇梦;视频生成组合使用奇梦、微度、拍我、海螺 [4] 五、 生产流程、成本与效率 * 核心工作流: * 长视频通过拼接大量5秒片段实现,依赖“图生视频”及“首尾帧控制”保障连续性 [19] * 跨模型片段衔接通过AI智能补帧、色彩校正、Runway进行4K提升、Topaz超分等后期处理实现 [21] * 效率提升: * 音画同步功能将人力投入压缩至原来的1/4,整体效率提升约70% [1][20] * 短剧场景因音画同步功能,人力成本压缩75%,整体效率提升约70% [1] * 成本结构: * 算力成本:短剧制作中,预估一分钟算力成本约1,000元 [29] * 报价变化:短剧制作报价较2025年已“腰斩”至5,000-10,000元/分钟 [29] * 成本波动:客户反复修改是成本波动主因,频繁返工会显著增加算力消耗 [30] * 成功率:团队视频成功率约50%,较早期大幅提升,关键在熟悉模型特性与提示词技巧 [23] 六、 当前技术瓶颈与挑战 * 视频时长:长视频(>10秒)可用性低,一次性生成1-2分钟会出现“鬼畜”,10秒以内最稳定 [2][19][22] * 输出画质:当前模型输出画质上限不足,多为720P,难以满足商业广告1080P以上高清要求,需依赖后期超分 [2][16][22] * 一致性控制:直接上传真人素材生成视频,可用率低,缺乏画面延续性,仍需回归“图生视频”工作流进行稳定控制 [16] * “AI感/油腻感”:部分模型生成的画面带有“油腻感”,影响审美,这与训练素材来源及图像生成质量有关 [12][13][15] * 平台限制:部分平台(如C站2.0)对人物素材(尤其是接近明星形象)上传有限制,影响人物一致性能力落地 [16] 七、 行业生态与团队发展 * 代表团队: * 精品内容方向:严川导演工作室、“兴安岭鬼市”团队 [32] * 产业化量产模式:“酱油酱油”公司(团队1,000多人)、“雪宝工作室”(代表作“后宫萌宝团”) [32] * 核心壁垒: * 内容能力:导演、审美、编剧、IP策划等创作端综合素质 [33] * 产业化能力:低成本、高效率、成熟流程的规模化生产能力 [33] * 团队规模与策略:典型团队约20人,计划扩张但控制在50人以内,更多采用与外包团队合作的方式 [39] * 平台政策:部分平台(如红果、抖音)对优质AI创作者有流量扶持或框架合作倾向,2026年起对AI视频的流量限制有所放开 [41] 八、 其他重要观察 * 价格下行主因:主要源于参与者增多导致的商业竞争加剧,以及“白嫖”路径对市场的冲击,而非单纯算力成本下降 [31] * 审美评估维度:核心指标是“AI感/油腻感”,其次是光影、构图等拍摄参数的可控性,不同模型因训练素材差异呈现不同质感 [12][13] * Token与成本趋势:随着即梦2.0等模型可用性提升,生成同样时长视频的Token占用量倾向于下降,整体成本有下降趋势 [38]
从创作者视角分享AI视频能力
2026-03-04 22:17