

AI视频生成竞争格局 - AI竞赛焦点转向多模态 字节和快手在AI视频赛道竞争激烈[1] - 根据Gartner 2024年新兴技术成熟度曲线 AI视频生成技术仍处于创新触发期[2] - 行业尚未出现类似DeepSeek在LLM领域的标杆性产品[2] 快手技术进展 - 正式发布可灵2.0视频生成模型及可图2.0图像生成模型[1][3] - 提出Multi-modal Visual Language(MVL)交互理念 由TXT和MMW组成[3] - 可图2.0拥有强大复杂语义理解能力和电影级画面质感 图生视频占可灵AI视频创作量85%[3] - 可灵AI全球用户规模突破2200万[1] - 截至2025年2月底 可灵AI累计营业收入超1亿元人民币[9] - 与小米、亚马逊云科技等企业合作 超1.5万开发者接入可灵AI API[9] 字节跳动技术进展 - 发布Seedream 3.0技术报告 综合性能追平文生图SOTA模型GPT-4o[1][4] - Seedream 3.0支持原生2K直出 生成时间仅需3秒[4] - 2024年9月发布豆包视频生成-PixelDance和豆包视频生成-Seaweed两款大模型[5] - 即梦AI月活增速达173.57% 位居全球AI产品增速榜第5 月活规模约2037万[1] 公司战略布局 - 快手将AI作为破解增长曲线难题的最大抓手 同时面向C端和B端提供服务[9] - 字节将即梦AI视为AI战略核心版图 试图打造AI时代的"抖音"[6][8] - 字节内部组建AGI长期研究团队"Seed Edge" 探索跨模态合作[9] - 两家公司都希望在AI时代复制新的"抖音"和"快手" 成功跨越新技术周期[8] 行业发展现状 - AI视频生成领域处于早期发展阶段 技术迭代速度快[2][7] - 产业界对AI视频生成价值存在分歧:可能是AIGC视频生产工具 也可能是通用视频武器[11] - 多模态技术未来可能应用于社交、游戏、VR、AR等多个领域[11] - 相较于大语言模型 AI视频生成在Scaling law、算力需求和商业模式方面挑战更大[11]