Veo3视频生成模型
搜索文档
字节一款AI产品爆火,黑神话之父冯骥:地表最强没有之一
21世纪经济报道· 2026-02-09 22:06
文章核心观点 - 字节跳动旗下AI视频生成模型Seedance 2.0凭借其突破性的“文本/图片生成电影级视频”能力引发行业震动,被评价为当前最强视频生成模型,并带动了A股传媒板块的上涨 [1] - Seedance 2.0在关键技术指标上实现突破,采用双分支扩散变换器架构,可在60秒内生成带原生音频的多镜头序列视频,其四大关键能力(自运镜和分运镜、全方位多模态思考、音画同步生成、多镜头叙事)的突破被认为可能成为AI影视发展的重要节点 [3] - 该模型的上线加剧了国内视频生成领域的竞争,行业进入类似2025年大语言模型的竞争状态,其有望在AI漫剧、AI短剧等短内容领域率先广泛应用,通过大幅降低成本和缩短周期来推动行业产能释放 [5][6] - Seedance 2.0在实测中展现出卓越性能,如自动生成多镜头叙事并保持一致性,但其训练数据来源与授权问题也引发争议,特别是涉及公众人物素材的使用,这反映了AI技术发展速度与法律规则完善进度不匹配的行业共性问题 [7][9][10] - 面对合规争议,公司在模型内测阶段已采取风险防控措施,如限制部分功能以防止滥用,行业专家认为在创新与数据合规、版权保护之间找到平衡是全球AI产业共同面临的课题 [12] 技术突破与性能 - 模型采用双分支扩散变换器架构,可同时生成视频和音频,用户通过详细提示或一张图片即可在60秒内生成带有原生音频的多镜头序列视频 [3] - 在自运镜和分运镜、全方位多模态思考、音画同步生成、多镜头叙事能力等四大关键能力上实现行业突破,可提供导演级的控制精度 [3] - 实测显示,模型的分镜设计具备“明显的角度切换”能力,能够“像真人导演一样不断改变摄影机的位置”,其多镜头叙事功能可根据单个提示自动生成关联场景,并保持角色、视觉风格的一致性,无需手动编辑 [7] - 在测试中,仅上传人脸照片,未提供声音文件,模型便自动生成了与本人高度相似且语气匹配的声音;仅上传楼栋正面照片,生成的运镜能转到楼栋背面,仿佛知晓未展示的场景细节 [9] 市场影响与行业格局 - Seedance 2.0上线后,带动A股传媒板块活跃,中文在线、掌阅科技等多只股票涨停,影视股也跟风上涨 [1] - 随着各家最新AI视频模型发布,国内视频生成领域的技术边界拓宽,赛道进入类似2025年大语言模型的竞争状态,后续差异化发展将体现在具体落地场景方面 [5] - 行业普遍认为,AI视频技术的成熟将重构内容生产产业链,从创意策划、制作拍摄到分发传播,AI将深度参与各个环节,掌握核心技术与流量入口的企业将在新产业格局中占据主导地位 [6] - Seedance 2.0有望在AI漫剧、AI短剧等短内容领域率先实现广泛应用,通过大幅降低制作成本、缩短生产周期,解决传统模式成本高、周期长、产能有限的问题,推动行业产能供给释放和产业链规模扩张 [6] 数据来源与合规争议 - 实测发现,模型可能将影视飓风团队过往发布的大量高清视频素材纳入训练数据集,从而能生成与创始人Tim高度相似的声音和场景 [9] - 行业专家指出,当前国内外AI大模型普遍使用公开数据进行训练,例如谷歌的Gemini多模态模型和Veo3视频生成模型使用了超过200亿个YouTube视频片段,OpenAI的Sora模型、StabilityAI的StableDiffusion也依赖于海量公开及许可视频数据 [10][11] - 与文字内容相比,声音和视频具有更强的个人与场景特定性,这使得数据使用的责任与边界问题更加凸显 [10] - 技术发展往往领先于行业规则的建立,训练过程中涉及的内容借鉴、版权关联等议题是技术突破必须面对的共性挑战,如何保护公众个人隐私、确保生成内容安全可靠是亟待解决的重要课题 [11] - 面对合规争议,公司在Seedance 2.0小范围内测阶段采取了风险防控措施,例如限制只有在进行活体认证的情况下可以生成真人视频,不支持输入真人图片/视频做主体参考,以防止AI技术被滥用 [12]
字节一款AI产品爆火 黑神话之父冯骥:地表最强没有之一
21世纪经济报道· 2026-02-09 22:03
文章核心观点 - 字节跳动旗下AI视频生成模型Seedance 2.0凭借其突破性技术能力引发行业震动,并带动了A股传媒板块的上涨,但其在训练数据来源与授权方面的合规问题也引发了广泛关注 [1][4][5][11] 技术突破与行业影响 - Seedance 2.0采用双分支扩散变换器架构,可同时生成视频和音频,用户通过文本或图片能在60秒内生成带原生音频的多镜头序列视频 [5] - 该模型在自运镜和分运镜、全方位多模态思考、音画同步生成、多镜头叙事能力等四大关键能力上实现行业突破,提供导演级控制精度 [6] - Seedance 2.0的发布被视为AI影视发展的重要节点,国内视频生成领域技术边界拓宽,赛道进入类似2025年大语言模型的激烈竞争状态 [6] - 行业普遍认为AI视频技术将重构内容生产产业链,掌握核心技术及流量入口的企业将在新产业格局中占据主导地位 [7] 市场反应与潜在应用 - Seedance 2.0话题于2月9日冲上微博热搜,并带动A股传媒板块多只股票如中文在线、掌阅科技等冲上涨停 [2][4] - 该模型有望在AI漫剧、AI短剧等短内容领域率先广泛应用,通过大幅降低制作成本、缩短生产周期来推动行业产能释放和规模扩张 [7] - 影视飓风创始人Tim发布的实测视频加速了模型“出圈”,其评测肯定了模型在视频精细度、摄像机运动流畅度、分镜连续性及音画匹配度上的突破性进展 [1][7][8] 数据合规与行业挑战 - 实测中发现,仅上传人脸照片,模型便能自动生成高度相似且语气匹配的声音;上传楼栋正面照片,模型能生成展示背面的运镜,引发对训练数据来源的质疑 [9][10] - 专家指出,当前国内外AI大模型普遍使用公开数据进行训练,例如谷歌的Gemini和Veo3使用了超过200亿个YouTube视频片段,OpenAI的Sora等也依赖海量公开及许可数据 [11][12] - 与文字内容相比,声音和视频数据具有更强的个人与场景特定性,使得数据使用的责任与边界问题在当前阶段更为凸显 [11] - 技术发展速度领先于法律规则完善,如何在创新与数据合规、版权保护间找到平衡是全球AI产业共同面临的挑战 [11][13] 公司的风险防控措施 - 针对合规争议,字节跳动在Seedance 2.0小范围内测阶段采取了风险防控措施,例如限制部分功能:仅在进行活体认证时可生成真人视频,不支持输入真人图片/视频作为主体参考,以防止技术滥用 [12]
字节一款AI产品爆火,黑神话之父冯骥:地表最强没有之一
21世纪经济报道· 2026-02-09 21:48
Seedance 2.0的技术突破与行业影响 - 字节跳动旗下AI视频生成模型Seedance 2.0在小范围内测阶段便引发海内外广泛关注,凭借“文本/图片生成电影级视频”的突破性能力成为焦点,并被《黑神话:悟空》之父冯骥评价为当前地表最强视频生成模型[1] - 该模型采用双分支扩散变换器架构,可同时生成视频和音频,用户只需编写详细提示或上传一张图片,即可在60秒内生成带有原生音频的多镜头序列视频[6] - 开源证券研报认为其在四大关键能力上实现行业突破:自运镜和分运镜、全方位多模态思考、音画同步生成、多镜头叙事能力,可为用户提供导演级的控制精度[6] - 影视飓风创始人Tim的实测视频进一步推动了模型“出圈”,他称赞其在视频精细度、摄像机运动流畅度、分镜连续性及音画匹配度上实现了行业突破性进展,并称其为“改变视频行业的AI”[7][8] - 实测显示,模型的分镜设计具备“明显的角度切换”能力,能够“像真人导演一样不断改变摄影机的位置”,其多镜头叙事功能可根据单个提示自动生成关联场景,并保持角色、视觉风格的一致性[8] 市场反应与竞争格局 - 在Seedance 2.0的带动下,2月9日A股传媒板块表现活跃,中文在线、掌阅科技等多只股票涨停,影视股也跟风上涨[3] - 东方证券研报指出,随着各家最新AI视频模型发布,国内视频生成领域的技术边界进一步拓宽,赛道进入类似2025年大语言模型的竞争状态,后续各家的差异化发展或体现在具体落地场景方面[6] - Seedance 2.0的上线为已在AI赛道布局的字节跳动再添筹码,行业认为随着AI视频技术成熟,内容生产产业链将重构,掌握核心技术与流量入口的企业将在新产业格局中占据主导地位[7] - 机构观点认为,Seedance 2.0有望在AI漫剧、AI短剧等短内容领域率先实现广泛应用,将大幅降低制作成本、缩短生产周期,推动行业产能供给释放[7] 技术发展引发的数据与合规挑战 - 在实测中,Tim发现仅上传个人人脸照片,模型便自动生成了与他本人高度相似的声音;上传仅含楼栋正面的照片后,模型生成的运镜能转到楼栋背面,仿佛“知晓未被展示的场景细节”[10] - Tim据此推断,其团队过往发布的大量高清视频素材已被纳入模型的训练数据集,这引发了关于大模型训练数据来源与授权问题的讨论[11] - 北京航空航天大学教授沙磊表示,目前国内外AI大模型都在使用公开数据进行训练,这是一个普遍的技术路径[11] - 例如,谷歌的Gemini多模态模型和Veo3视频生成模型使用了超过200亿个YouTube视频片段;OpenAI的Sora模型、StabilityAI的Stable Diffusion等也依赖于海量的公开及许可视频数据[11][12] - 中国科学院软件研究所研究员张立波指出,与文字内容相比,声音和视频具有更强的个人与场景特定性,这使得当前阶段数据使用的责任与边界问题更加凸显[12] - 面对合规争议,字节跳动在Seedance 2.0小范围内测阶段已采取风险防控措施,例如限制部分模型功能,只有在进行活体认证的情况下可以生成真人视频,不支持输入真人图片/视频做主体参考等,以防止技术被滥用[13] - 沙磊认为,这种功能限制是企业在技术发展时要守住的责任底线,并强调如何在创新与数据合规、版权保护之间找到平衡是全球AI产业共同的命题[13]
火山引擎原动力大会将召开,科创板人工智能ETF(588930)盘中溢价,机构:当前时点着重看好AI应用投资机会
21世纪经济报道· 2025-06-09 10:07
市场表现 - 6月9日A股三大指数集体高开 科技方向小幅上涨 上证科创板人工智能指数涨0.20% [1] - 科创板人工智能ETF(588930)涨0.09% 盘中溢价率0.11% 成分股海天瑞声涨超4% 有方科技/道通科技/麒麟信安跟涨 [1] - 6月6日科创板人工智能ETF(588930)获资金净流入688万元 [1] 政策动态 - 工信部6月6日召开两化融合工作会议 审议《工业和信息化部信息化和工业化融合2025年工作要点》 [2] - 政策要求推进数字化网络化智能化升级 加快重点行业数字化转型实施方案 实施"人工智能+制造"行动 [2] - 政策强调加快提升软硬件产品供给能力 强化工业软件/智能传感器技术攻关 建设工业高质量数据集 [2] 行业进展 - 火山引擎2025原动力大会·春于6月11-12日举行 聚焦大模型与AI云原生等前沿领域 [3] - 多模态动态更新密集:谷歌5月21日推出Veo3视频生成模型 豆包5月23日上线视频通话功能 快手可灵AI ARR在2025年3月突破1亿美金 4月和5月月度付费金额均突破1亿元人民币 [3] - 海外算力厂商业绩持续超预期 国内外模型及应用创新不断涌现 [3] 机构观点 - 重点把握人工智能技术与产业革命机遇 关注政策驱动机会 中期重点关注人工智能方向 [4] - 当前时点着重看好AI应用投资机会 包括通用场景泛ERP领域/生产力工具 垂直场景金融AI/医疗IT/物理AI/工业场景 [4] - 算力方向基本面有望延续高景气态势 短期重点关注信创为主的政策驱动方向 [4]
中信建投:多模态产品密集更新,关注WWDC及字节火山大会进展
快讯· 2025-06-09 08:27
多模态动态更新 - 谷歌在2025I/O大会上推出Veo3视频生成模型,实现AI视频音画同步 [1] - 豆包上线视频通话功能,支持实时视频交流及屏幕分享 [1] - 快手宣布可灵AI ARR在2025年3月突破1亿美金,4月和5月月度付费金额均突破1亿人民币 [1] 行业会议展望 - 苹果WWDC2025和字节Force2025原动力大会即将召开 [1] - 多模态模型和端侧AI产品有望加速落地 [1]