可灵(Kling)3.0
搜索文档
AI漫剧2026:千亿深水区的工业化豪赌与审美突围
36氪· 2026-02-26 07:44
行业现状与市场增长 - AI漫剧已从微短剧体系中的“新鲜尝试”升级为拥有独立用户心智、产值惊人的黄金赛道,行业正经历从“草台班子”向工业化巨头的集体进化 [1] - 2025年漫剧在投数量全年增长超过76倍,2026年市场规模达到243.6亿元,乐观预估到2030年该细分赛道规模将达到850亿元 [1] 生产模式变革与成本效率 - AI漫剧制作成本已控制在每分钟1000至2500元之间,相比传统动画制作(单分钟成本数万至数十万元)实现了效率的“降维打击” [7][9] - 12人小团队可在30天内制作出《斩仙台下,我震惊了诸神》这样的精品,并收获超10亿次播放量 [9] - 催生了“抽卡师”(提示词工程师)这一新职业,人机协作模式使《明日周一》在45天内交付并实现约200万元净利润 [10] 技术突破 - AI视频生成技术取得突破,解决了画面闪烁、人物变脸、动作僵硬等问题,例如Seedance 2.0实现了视频与音轨的同步原生生成,口型匹配达到毫秒级精度 [11] - AI具备了“多镜头叙事”能力,能保持角色在场景切换中的一致性,并生成具有大范围摄像机运动、景别变化和时空连贯的完整叙事序列 [13] - 技术突破使得一般性视频的制作成本逐渐趋近于算力的边际成本 [13] 流量格局与商业模式演变 - 2025年漫剧在抖音、红果等平台总播放量突破700亿次,较前一年增长10倍 [14] - 平台为抢夺优质内容提供高达90%的分成比例,单部剧保底金额最高可达360万至500万元 [14] - 纯付费漫剧的ROI已下滑至1.1左右,全市场仅前5%头部厂商能维持1.2以上的收益,迫使大量厂商转向“免费播出、广告解锁”的IAA模式 [18] - 漫剧成为连接消费与商业的枢纽,例如《有山灵》联名产品上线两周GMV突破200万,《王蓝莓的幸福生活》成功跑通漫剧IP游戏化链路 [20] 上游IP价值与内容生态 - AI让文字IP以零边际成本实现视频化,阅文集团开放10万部精品IP,番茄小说开放6万部原创作品并设立亿元创作基金支持改编 [21] - 成熟IP为漫剧提供完整世界观与流量基础,显著降低内容冷启动难度,近半年爆款漫剧中IP改编作品占比已超过60% [27] - 爆款IP《从赖皮蛇开始吞噬进化》上线一周播放量即破2亿,验证了“爆款IP+AI产能”的变现路径 [25] 行业竞争格局与从业者现状 - 行业头部效应明显,头部公司如“酱油文化”月营收可达5000万元,其核心壁垒在于对提示词工程人才的垄断和对影视编导技巧的深刻理解 [28] - 90%的中小工作室处于“白忙活”状态,承制单价从早期的每分钟3000-5000元被压缩至400-1000元 [28] - 为保证作品质量,从业者需进行大量手工修复,加班至深夜成为常态,导致高职业倦怠感和离职率 [28] 法律与版权挑战 - AI漫剧发展撞击现行法律边界,例如2026年初灵境万维与漫谭文化之间的版权纠纷案 [29] - 对于生命周期仅1-2个月的漫剧,漫长的诉讼周期常导致“赢了官司输了市场”,通过平台建立快速的侵权反馈与阻断机制成为高效解决手段 [31] 全球化拓展 - 预计2026年微短剧出海规模将突破60亿至90亿美元,中企出海应用已占据该领域90%以上的内购收入 [32] - 相比真人剧,漫剧文化跨越障碍更小,本土化调整成本更低,点众科技、枫叶互动、昆仑万维旗下平台已锁定千万级海外月活用户 [32] - 创作者利用AI工具快速生产符合西方受众口味的题材,这种“数据驱动+AI产能”模式对欧美本土制作方构成压力 [34][35] 未来发展趋势 - AI正从生成工具进化为“智能体AI”,未来将向“物理智能”和“世界模型”进军,能够理解并模拟物理世界规律 [36] - 未来AI将驱动漫剧向高品质2D/3D升级,并融合互动叙事提升沉浸感 [36] - 在工具门槛消失的时代,真正的竞争壁垒将回归内容本质,锁定在能讲好故事、精准捕捉群体情绪的创意上 [36]
多模态“Deepseek时刻”下的大厂分化:字节拼“效率”,快手攻“专业”,阿里聚焦“电商”!
硬AI· 2026-02-12 23:44
文章核心观点 - 国产多模态AI视频模型在2025年初密集更新,其核心突破在于显著提升了生成过程的“可控性”,标志着技术从娱乐性“炫技”向可进入工业化工作流的实用工具跨越 [1][2] - 技术跨越的关键在于通过提升跨镜头主体一致性、复杂指令语义遵循和生成后编辑等能力,有效压低“抽卡”式生成导致的废片率,从而将视频生产的边际成本向算力成本收敛,为商业化扫清障碍 [1][5][8] - 主要厂商战略路径出现分化:字节跳动侧重打造低门槛的“效率基建”,快手深耕追求“大片感”的专业叙事,而阿里巴巴则更聚焦于电商等垂直场景,这预示着不同的商业模式未来 [5][19] - AI视频技术的进步将引发内容供给侧革命,短期内将提升营销、电商及短剧等内容生产效率,中长期则将推动IP价值重估,并使拥有强大算力基础设施和闭环流量场景的巨头受益 [2][5][20] 技术升级与可控性突破 - 2025年1月至2月,快手、字节跳动、阿里巴巴密集发布多模态模型新版本,包括快手的可灵(Kling)3.0、字节的Seedance 2.0和Seedream 5.0、阿里的Qwen-Image-2.0 [1] - 新一代模型升级重点从单纯追求画质转向优先提升“可控性”,具体包括跨镜头主体一致性、复杂指令的语义遵循以及“生成后还能改”的编辑能力,旨在系统性压低废片率 [5][8] - 技术跨越使得AI视频具备了进入规模化B端工作流的基础,预计电商广告、短剧/漫剧制作等领域将更早感受到冲击 [5] 主要模型能力分析 - **快手可灵(Kling) 3.0**:关键词是“系统升级”与“生成编辑一体化(Omni)” [10] - 视频侧:强化多镜头/连续动作下的主体一致性、复杂文本指令解析,并缓解多人同框指代混乱,支持多语种、方言口音演绎与精准口型匹配 [10] - 引入Omni模式,支持对已生成内容进行局部可控修改,减少推倒重来 [10] - 新增专业创作能力:可创建视频主体(提取角色特征与音色进行驱动)、原生自定义分镜,并将单次生成时长提升至15秒,允许在镜头级别指定时长、景别、视角等参数 [10] - 图片侧:可灵图片3.0支持最多10张参考图以锁定主体与风格,支持批量组图输出,强化了高清输出与细节表现,旨在补全工作流 [13] - **字节跳动Seedance 2.0**:定位为“工业化标准”工具,强调物理规律合理、动作自然、指令精准、风格稳定 [16] - 核心能力包括:一致性优化(覆盖人脸、服装、字体等细节)、高难度运镜与动作的可控复刻、创意模板/复杂特效的精准复刻 [16] - 采用创新的“@素材名”交互范式,将黑盒式生成拆解为可控生产流程,模型可分别提取视频的运镜、图片的细节、音频的节奏,从而显著降低废片率 [18] - 设定了明确的生产约束:支持最多9张图片、3个总时长不超过15秒的视频、3个总时长不超过15秒的MP3音频文件混合输入,生成时长可选4-15秒 [18] 行业竞争格局与战略分野 - 字节跳动路线被概括为“效率基建”,致力于提供低门槛、低成本的工具化与泛化能力,类似“剪映”的高级形态,目标是降低全网内容生产成本并反哺自身生态 [19] - 快手可灵路线押注“专业叙事”,专注于物理模拟、复杂场景真实感与角色一致性,更适合影视Demo、电影剧情等对连贯性要求高的专业内容生产 [19] - 阿里巴巴千问路线更偏垂直场景(如电商),在图像模型高保真更新方向上强化商品数字化相关能力,追求垂直行业的“可用即生产” [19] - 三条路径对应不同的商业模式:规模化吞吐、高质量叙事交付、垂直行业深度应用 [19] 商业化影响与投资线索 - **供给侧革命**:图像与视频基座能力提升后,内容生产的边际成本将越来越趋向于算力成本 [5][20] - **短期影响**:营销/电商服务商的素材产出效率将提高,带来毛利改善;漫剧、短剧行业可能出现产能爆发 [20] - **中长期影响**:内容生产门槛降低将推动IP价值重估,头部IP及衍生品价值更高,腰部IP也可能通过AI视频化实现价值重估 [20] - **受益方向**:报告将投资线索落在内容IP、内容版权、AI视频工具/模型,以及云与平台的推理侧需求上 [5][20] 附录:模型性能与定价参考(部分) - **文生图模型榜单(节选)**:在相关评测中,OpenAI的GPT Image 1.5 (high) O以ELO评分1,264位列第一,其API定价为每千张图像133.0美元;字节跳动的Seedream 4.0评分为1,189,定价为每千张图像30.0美元 [3] - **文生视频模型榜单(节选)**:在相关评测中,xAI的grok-imagine-video以ELO评分1,241位列第一,其API定价为每分钟4.20美元;快手的Kling 2.5 Turbo 1080p评分为1,217,定价为每分钟4.20美元;OpenAI的Sora 2 Pro评分为1,208,定价为每分钟30.00美元 [4]
多模态“Deepseek时刻”下的大厂分化:字节拼“效率”,快手攻“专业”,阿里聚焦“电商”!
华尔街见闻· 2026-02-12 14:35
文章核心观点 - AI视频生成技术正从“盲盒式娱乐”向“精准工业化生产”跨越,其商业化核心障碍“抽卡”导致的边际成本不可控问题正通过提升模型可控性得到解决,技术跨越使AI视频具备进入规模化B端工作流的基础[1] - 新一代多模态模型(如可灵3.0、Seedance 2.0)的升级重点在于提升可控性以压低废片率,包括跨镜头主体一致性、复杂指令语义遵循和生成后编辑能力,从而将商业化门槛从“能不能做”转变为“能不能稳定交付”[4][5] - 主要厂商战略出现分化:字节跳动(字节)侧重“效率基建”,快手押注“专业叙事”,阿里巴巴(阿里)偏向电商垂直场景,这指向了规模化吞吐、高质量叙事交付和垂直行业“可用即生产”三种不同的商业模式[13] - 技术演进将引发内容供给侧革命,内容生产的边际成本将越来越趋向算力成本,短期利好营销/电商及短剧行业效率提升,中长期则使IP稀缺性价值更为凸显,同时拥有强算力基础设施和闭环流量场景的巨头将受益于推理侧需求增长[14] 多模态模型近期密集升级 - 2025年1月至2月初,中国科技公司密集发布多模态模型更新:1月31日快手推出可灵(Kling)3.0,2月7日字节发布Seedance 2.0,2月10日字节发布Seedream 5.0,阿里发布Qwen-Image-2.0[1] 图像生成模型竞争格局(基于ELO评分) - 在图像生成领域,OpenAI的GPT Image 1.5 (high) O模型以ELO评分1264位居榜首,API定价为每千张图像133.0美元[2] - 谷歌的Nano Banana Pro (Gemini 3 Pro Image)以ELO评分1222位列第二,API定价为每千张图像134.0美元[2] - Black Forest Labs的FLUX.2 [max]模型以ELO评分1211位列第三,API定价为每千张图像70.0美元[2] - 字节跳动的Seedream 4.0和4.5模型分别以ELO评分1189和1172位列第五和第八,API定价分别为每千张图像30.0美元和40.0美元[2] 视频生成模型竞争格局(基于ELO评分) - 在视频生成领域,xAI的grok-imagine-video模型以ELO评分1241位居第一,API定价为每分钟4.20美元[3] - Vidu的Vidu Q3 Pro以ELO评分1240位列第二,API定价为每分钟9.60美元[3] - Runway的Gen-4.5以ELO评分1231位列第三,暂无API可用[3] - OpenAI的Sora 2 Pro以ELO评分1208位列第十,API定价为每分钟30.00美元[3] - 快手的Kling系列模型(如2.5 Turbo 1080p、O1 Pro)在榜单中占据多个席位,API定价在每分钟4.20美元至10.08美元之间[3] 快手可灵(Kling)3.0的核心升级 - 可灵3.0的升级关键词是基础能力系统升级以及生成与编辑的一体化(Omni)[6] - 视频侧升级重点包括:增强多镜头/连续动作场景下的主体一致性、细化复杂文本指令解析、缓解多人同框指代混乱,并强调文本与视觉角色的精准映射(支持多语种、方言口音演绎与自然口型神态)[6] - 引入Omni模式,支持在已生成内容基础上进行局部可控修改,减少推倒重来[6] - 新增专业创作能力:可创建视频主体(提取角色特征与原声音色,做精准口型匹配与驱动)以及原生自定义分镜能力[6] - 将单次生成时长提升至15秒,并允许在镜头级别指定时长、景别、视角、叙事内容和运镜方式[6] - 图片侧,可灵图片3.0支持最多10张参考图以锁定主体轮廓与色调、支持多参考图元素自由指定与编辑、支持批量组图输出用于故事板制作,并强化高清输出与细节表现[7] - 能力对比显示,可灵视频3.0相较于2.6版本,新增或增强了图生视频、首尾帧生视频、智能分帧、首帧+主体参考、三人及以上指代、多语种支持、方言口音支持、生成时长15秒及灵活自定义秒数等多项功能[8] 字节跳动Seedance 2.0的核心升级 - Seedance 2.0的定位更偏向“工业化标准”,基础层面强调物理规律合理、动作自然、指令理解精准和风格保持稳定[9] - 突出三类能力:一致性优化(覆盖人脸、服装、字体细节、场景跳变等)、高难度运镜与动作的可控复刻、创意模板/复杂特效的精准复刻[9] - 关键交互范式是使用“@素材名”指定图片/视频/音频用途,将黑盒式生成拆解为可控生产流程,模型可分别提取不同素材的特征(如运镜、细节、节奏),从而显著降低废片率[12] - 使用限制贴近生产约束:支持图片输入≤9张;视频输入≤3个且总时长不超过15秒;音频支持MP3上传≤3个且总时长不超过15秒;混合输入总上限12个文件;生成时长≤15秒(可选4-15秒);并提供自带音效/配乐输出[12] 主要厂商战略路径分化 - 字节跳动路线:侧重于低门槛、低成本的工具化与泛化能力,类似“剪映”的高级形态,目标是降低全网内容生产成本并反哺自身生态,定位为“效率基建”[13] - 快手路线:押注物理模拟、复杂场景真实感与角色一致性,更适合影视Demo、电影剧情等对连贯性要求高的专业内容,定位为“专业叙事”[13] - 阿里巴巴路线:其千问图像模型在高保真更新方向上更偏向电商等垂直场景,强化商品数字化相关能力,追求垂直行业的“可用即生产”[13] 行业影响与投资线索 - 技术跨越让AI视频具备进入规模化B端工作流的基础,电商广告、短剧/漫剧制作会更早感受到冲击[4] - 内容供给侧将发生革命,图像与视频基座能力提升后,内容生产的边际成本会越来越趋向算力成本[14] - 短期更看好两类变化:营销/电商服务商的素材产出效率提高带来毛利改善;漫剧、短剧行业可能出现产能爆发[14] - 中长期矛盾推向IP端:当内容更容易被生产,稀缺性的定价会更集中到IP上,头部IP及衍生品价值更高,腰部IP也可能通过AI视频化实现价值重估[14] - 拥有强算力基础设施(云)和闭环流量场景(平台)的巨头,会更直接吃到推理侧频繁调用带来的红利[14] - 对应的投资线索将受益方向落在内容IP、内容版权、AI视频工具/模型,以及云与平台的推理侧需求上[4]