Workflow
Animate Anyone
icon
搜索文档
字节不需要物理学家
36氪· 2026-02-10 13:13
文章核心观点 - AI视频生成技术已取得突破性进展,特别是字节跳动的Seedance 2.0,其理解用户意图、生成符合镜头语言和叙事节奏的视频能力,标志着视频行业的“GPT-3.5时刻”可能已经到来 [1] - 中美科技巨头在AI视频领域的发展路径存在根本性差异:OpenAI的Sora致力于成为“世界模拟器”,追求物理真实;而字节的Seedance则致力于成为“导演模拟器”,追求叙事与情绪表达 [9][10][12][14] - 中国主要互联网公司的AI视频战略由其核心商业基因决定,正围绕各自生态位展开竞争,这将重塑内容产业的格局与工作流 [15][16][22][23][24] 技术能力与产品体验 - **理解与执行能力**:Seedance 2.0能基于单张照片,理解复杂指令并生成符合要求的视频,例如根据自拍照生成特定风格的Vlog、理解并规避版权元素生成“梗”视频、以及结合多模态搜索与知识库生成模仿特定博主口吻的视频 [3][4][5] - **人物复刻与真实性**:该技术能够仅凭一张照片,高度逼真地复刻人物的长相、声音、语气甚至微表情,生成足以以假乱真的视频,击穿了“真实”的防线 [6][7][8] - **镜头语言与成片能力**:Seedance 2.0的核心优势在于理解电影语言,能自动进行运镜、分镜、音画匹配,并自带配乐与剪辑节奏,是一个“成片生成器” [12][13][14] 行业竞争格局与公司战略 - **字节跳动 (Seedance)**:定位为“商业导演”或“导演模拟器”,产品是娱乐工具,旨在让用户“玩”,核心是生成“最好看”的世界 [9][14][22] - **快手 (可灵/Kling)**:定位为“现实复刻者”,走极度“写实流”,强调物理规律连贯,是服务于网文推文、短剧等内容创作者的变现生产力工具;其商业化进展迅速,自2024年中启动后,2025年全年收入预计达1.4亿美元(约10亿元人民币),仅7个月累计收入便突破1亿元,2025年12月单月收入突破2000万美元 [16][17][22] - **阿里巴巴**:定位为“电商工具”,技术如EMO和Animate Anyone核心是解决让“人”在视频里卖货的问题,将AI视频变为SaaS服务,旨在节省模特、主播等成本 [18][19][22] - **腾讯 (混元视频/Hunyuan)**:定位为“社交基建”,采取开源策略,走“安卓路线”,旨在成为AI视频时代的“水和电”,支持120秒长视频并强调中文原生理解,以服务其社交与内容生态 [20][22] - **百度 (MuseSteamer/蒸汽机)**:定位为“工业生产”,打法聚焦B端,为企业提供批量生产营销视频、数字人分身等服务,是标准的工程师思维和To B基因的延续 [21][22] 对内容产业的影响与冲击 - **工作流重构**:AI视频技术将彻底改变传统视频制作流程,从策划、拍摄到剪辑、后期的一条长链条被极大简化,实现了从“意图”到“成片”的直接输出,这被称为“意图界面”(Intent UI) [24][25][26][27] - **组织架构变革**:传统的“编导+摄像+剪辑”铁三角模式正在解体,未来视频公司可能不再需要庞大的制作团队,仅需少数拥有审美和意图的“超级个体”与AI协同 [28] - **从业者分化**:技术将加剧从业者分化,顶级艺术家和能熟练驾驭AI的“超级个体”将更具价值,而仅具备基础执行技能的“工具人”职业前景堪忧 [29] 伴随技术进步的关键议题 - **数据与契约问题**:AI模型使用用户在互联网上公开的数据(如照片、视频)进行训练,但用户并未从中获得分红或被告知,存在“不对等”的契约关系 [31] - **信任危机**:高度逼真的深度伪造技术可能摧毁社会信任基石,使得“眼见为实”不再成立,需要辨别视频内容的真伪 [32] - **版权风险**:AI生成内容可能涉及对现有IP的模仿或“玩梗”,存在侵犯版权的法律风险,需要行业规则加以规范 [32]
“百度不做”,仅仅一年,李彦宏反悔了
搜狐财经· 2025-10-20 16:59
行业战略转变 - 百度创始人李彦宏在2024年10月内部讲话中表示AI视频大模型投入周期过长可能10年或20年都无法获得业务收益因此百度不会去做此类模型 [1] - 2025年9月30日Sora 2发布后仅14天百度便高调推广其AI视频模型“百度蒸汽机”与谷歌Veo 3.1形成竞争态势显示公司战略从回避转向积极参与 [2] - 中国AI视频应用从2024年初Sora发布时的沉寂转变为2025年的火热各大厂商包括阿里、腾讯、字节、百度均推出产品市场竞争加剧 [4][12] 技术差距与演进 - 2024年2月Sora通过“建构现实”能力超越其他仅“模拟现实”的应用例如能再现咬苹果留下齿痕的物理规则细节提升视频真实感 [5] - 2024年中国大厂因基础大模型与Open AI、谷歌存在巨大差距优先聚焦追赶GPT-4而非开发文生视频模型导致初期回避Sora竞争 [10][12] - 2025年初深度求索推出“物美价廉”的DeepSeek模型减轻行业焦虑基础大模型竞争迭代加速成本下降推动多模态能力发展 [12] - 当前AI视频模型沿两大方向演进:视频质量提升如画面更真实、提示词更准确以及用户编辑能力强化如局部修改和对象增删 [15] - 音频即时生成功能填补了AI视频仅能制作“默片”的短板而测试显示Sora 2注重娱乐性谷歌Veo 3.1强调物理规则差异化竞争明显 [16][17] 商业化前景 - Sora 2通过成本降低和可用性增强用户可直接生成复杂电影片段减少修改需求AI演员如蒂利·诺伍德出现可能替代真人颠覆传统影视行业 [19][20] - Sora 2推出免费用户“一键创作视频”功能推动从网页端向APP移动端战略下沉通过个性化设计如插入用户形象加速社交传播 [22] - Open AI计划为创作者提供变现机制目标是让90%以上免费用户找到盈利途径构建类似TikTok的用户生产与消费闭环平台 [22][24] - 全球生成式AI视频竞争加剧但平台化机会有限同一类型“平台”数量不会太多导致厂商间血腥厮杀以争夺主导地位 [24]