意图界面（Intent UI） - 财报，业绩电话会，研报，新闻

意图界面（Intent UI）

搜索文档

36氪· 2026-02-10 13:13

文章核心观点 - AI视频生成技术已取得突破性进展，特别是字节跳动的Seedance 2.0，其理解用户意图、生成符合镜头语言和叙事节奏的视频能力，标志着视频行业的“GPT-3.5时刻”可能已经到来 [1] - 中美科技巨头在AI视频领域的发展路径存在根本性差异：OpenAI的Sora致力于成为“世界模拟器”，追求物理真实；而字节的Seedance则致力于成为“导演模拟器”，追求叙事与情绪表达 [9][10][12][14] - 中国主要互联网公司的AI视频战略由其核心商业基因决定，正围绕各自生态位展开竞争，这将重塑内容产业的格局与工作流 [15][16][22][23][24] 技术能力与产品体验 - **理解与执行能力**：Seedance 2.0能基于单张照片，理解复杂指令并生成符合要求的视频，例如根据自拍照生成特定风格的Vlog、理解并规避版权元素生成“梗”视频、以及结合多模态搜索与知识库生成模仿特定博主口吻的视频 [3][4][5] - **人物复刻与真实性**：该技术能够仅凭一张照片，高度逼真地复刻人物的长相、声音、语气甚至微表情，生成足以以假乱真的视频，击穿了“真实”的防线 [6][7][8] - **镜头语言与成片能力**：Seedance 2.0的核心优势在于理解电影语言，能自动进行运镜、分镜、音画匹配，并自带配乐与剪辑节奏，是一个“成片生成器” [12][13][14] 行业竞争格局与公司战略 - **字节跳动 (Seedance)**：定位为“商业导演”或“导演模拟器”，产品是娱乐工具，旨在让用户“玩”，核心是生成“最好看”的世界 [9][14][22] - **快手 (可灵/Kling)**：定位为“现实复刻者”，走极度“写实流”，强调物理规律连贯，是服务于网文推文、短剧等内容创作者的变现生产力工具；其商业化进展迅速，自2024年中启动后，2025年全年收入预计达1.4亿美元（约10亿元人民币），仅7个月累计收入便突破1亿元，2025年12月单月收入突破2000万美元 [16][17][22] - **阿里巴巴**：定位为“电商工具”，技术如EMO和Animate Anyone核心是解决让“人”在视频里卖货的问题，将AI视频变为SaaS服务，旨在节省模特、主播等成本 [18][19][22] - **腾讯 (混元视频/Hunyuan)**：定位为“社交基建”，采取开源策略，走“安卓路线”，旨在成为AI视频时代的“水和电”，支持120秒长视频并强调中文原生理解，以服务其社交与内容生态 [20][22] - **百度 (MuseSteamer/蒸汽机)**：定位为“工业生产”，打法聚焦B端，为企业提供批量生产营销视频、数字人分身等服务，是标准的工程师思维和To B基因的延续 [21][22] 对内容产业的影响与冲击 - **工作流重构**：AI视频技术将彻底改变传统视频制作流程，从策划、拍摄到剪辑、后期的一条长链条被极大简化，实现了从“意图”到“成片”的直接输出，这被称为“意图界面”（Intent UI） [24][25][26][27] - **组织架构变革**：传统的“编导+摄像+剪辑”铁三角模式正在解体，未来视频公司可能不再需要庞大的制作团队，仅需少数拥有审美和意图的“超级个体”与AI协同 [28] - **从业者分化**：技术将加剧从业者分化，顶级艺术家和能熟练驾驭AI的“超级个体”将更具价值，而仅具备基础执行技能的“工具人”职业前景堪忧 [29] 伴随技术进步的关键议题 - **数据与契约问题**：AI模型使用用户在互联网上公开的数据（如照片、视频）进行训练，但用户并未从中获得分红或被告知，存在“不对等”的契约关系 [31] - **信任危机**：高度逼真的深度伪造技术可能摧毁社会信任基石，使得“眼见为实”不再成立，需要辨别视频内容的真伪 [32] - **版权风险**：AI生成内容可能涉及对现有IP的模仿或“玩梗”，存在侵犯版权的法律风险，需要行业规则加以规范 [32]