字节一款AI产品爆火，黑神话之父冯骥：地表最强没有之一

文章核心观点 - 字节跳动旗下AI视频生成模型Seedance 2.0凭借其突破性的“文本/图片生成电影级视频”能力引发行业震动，被评价为当前最强视频生成模型，并带动了A股传媒板块的上涨 [1] - Seedance 2.0在关键技术指标上实现突破，采用双分支扩散变换器架构，可在60秒内生成带原生音频的多镜头序列视频，其四大关键能力（自运镜和分运镜、全方位多模态思考、音画同步生成、多镜头叙事）的突破被认为可能成为AI影视发展的重要节点 [3] - 该模型的上线加剧了国内视频生成领域的竞争，行业进入类似2025年大语言模型的竞争状态，其有望在AI漫剧、AI短剧等短内容领域率先广泛应用，通过大幅降低成本和缩短周期来推动行业产能释放 [5][6] - Seedance 2.0在实测中展现出卓越性能，如自动生成多镜头叙事并保持一致性，但其训练数据来源与授权问题也引发争议，特别是涉及公众人物素材的使用，这反映了AI技术发展速度与法律规则完善进度不匹配的行业共性问题 [7][9][10] - 面对合规争议，公司在模型内测阶段已采取风险防控措施，如限制部分功能以防止滥用，行业专家认为在创新与数据合规、版权保护之间找到平衡是全球AI产业共同面临的课题 [12] 技术突破与性能 - 模型采用双分支扩散变换器架构，可同时生成视频和音频，用户通过详细提示或一张图片即可在60秒内生成带有原生音频的多镜头序列视频 [3] - 在自运镜和分运镜、全方位多模态思考、音画同步生成、多镜头叙事能力等四大关键能力上实现行业突破，可提供导演级的控制精度 [3] - 实测显示，模型的分镜设计具备“明显的角度切换”能力，能够“像真人导演一样不断改变摄影机的位置”，其多镜头叙事功能可根据单个提示自动生成关联场景，并保持角色、视觉风格的一致性，无需手动编辑 [7] - 在测试中，仅上传人脸照片，未提供声音文件，模型便自动生成了与本人高度相似且语气匹配的声音；仅上传楼栋正面照片，生成的运镜能转到楼栋背面，仿佛知晓未展示的场景细节 [9] 市场影响与行业格局 - Seedance 2.0上线后，带动A股传媒板块活跃，中文在线、掌阅科技等多只股票涨停，影视股也跟风上涨 [1] - 随着各家最新AI视频模型发布，国内视频生成领域的技术边界拓宽，赛道进入类似2025年大语言模型的竞争状态，后续差异化发展将体现在具体落地场景方面 [5] - 行业普遍认为，AI视频技术的成熟将重构内容生产产业链，从创意策划、制作拍摄到分发传播，AI将深度参与各个环节，掌握核心技术与流量入口的企业将在新产业格局中占据主导地位 [6] - Seedance 2.0有望在AI漫剧、AI短剧等短内容领域率先实现广泛应用，通过大幅降低制作成本、缩短生产周期，解决传统模式成本高、周期长、产能有限的问题，推动行业产能供给释放和产业链规模扩张 [6] 数据来源与合规争议 - 实测发现，模型可能将影视飓风团队过往发布的大量高清视频素材纳入训练数据集，从而能生成与创始人Tim高度相似的声音和场景 [9] - 行业专家指出，当前国内外AI大模型普遍使用公开数据进行训练，例如谷歌的Gemini多模态模型和Veo3视频生成模型使用了超过200亿个YouTube视频片段，OpenAI的Sora模型、StabilityAI的StableDiffusion也依赖于海量公开及许可视频数据 [10][11] - 与文字内容相比，声音和视频具有更强的个人与场景特定性，这使得数据使用的责任与边界问题更加凸显 [10] - 技术发展往往领先于行业规则的建立，训练过程中涉及的内容借鉴、版权关联等议题是技术突破必须面对的共性挑战，如何保护公众个人隐私、确保生成内容安全可靠是亟待解决的重要课题 [11] - 面对合规争议，公司在Seedance 2.0小范围内测阶段采取了风险防控措施，例如限制只有在进行活体认证的情况下可以生成真人视频，不支持输入真人图片/视频做主体参考，以防止AI技术被滥用 [12]