Workflow
Movie Gen
icon
搜索文档
对话快手可灵丨AI 新世界加载中,我们还能做些什么?
雪豹财经社· 2025-07-02 10:22
核心观点 - AI生成视频技术已具备一定成熟度,尤其在写实风格表达和运动表现方面表现突出,但距离高水准大银幕制作仍有差距 [7][16] - 行业处于快速迭代期,国内外巨头加速入场,可灵AI凭借高频迭代(一年22次)和综合实力保持Tier 1水平 [8][23] - AI工具在短剧、广告、游戏等领域已实现商业化应用,尤其在科幻类内容制作中可节省50%-70%成本 [7][28][29] 技术进展 - 可灵AI 2.1模型在语义遵从、运动表现(速度/自然度/物理规律符合度)等基础能力显著提升,支持高速运动与极致互动表现 [10][16] - 视频生成技术突破点包括:水流波动/动物毛发纹理的真实渲染、长镜头表情变化细腻度、二维动漫打斗动作流畅度 [3][16] - 当前技术短板集中于运动模糊、边缘模糊、群像人脸崩坏等稳定性问题,音效同步能力暂未布局 [18] 商业化表现 - 可灵AI全球用户达2200万,企业及开发者超1万,Q1营收1.5亿元(70%来自P端订阅) [8] - 定价策略激进:5秒视频3.5元(0.7元/秒),低于行业1元/秒均价 [19] - 主要落地场景:短剧大空镜/战争场面生成(成本节省50%)、宠物魔改视频、广告特效模板 [7][15][29] 行业竞争格局 - 全球视频生成赛道形成百花齐放格局:可灵与谷歌Veo分列文生视频/图生视频全球前二,Meta Movie Gen、阿里通义万相2.1、字节即梦AI等相继入场 [8] - 核心竞争力差异:谷歌Veo依托YouTube数据强化音画同步,可灵聚焦基础模型迭代与创作者生态建设 [18][20] - 行业仍处早期阶段,技术迭代、创作者生态搭建、商业化路径探索为共同挑战 [8][24] 应用前景 - 科幻/魔幻类内容降本效果最显著,可达传统制作成本的1/50-1/2,现实主义题材因观众敏感度较高应用受限 [29][31] - 动画制作效率提升至传统工时的1/3,资金成本降低至1/2以下 [7][32] - 未来方向包括简化创作流程、强化多模态融合、拓展C端用户破圈 [15][17]
视频生成大模型群雄逐鹿 却不温不火
中国经营报· 2025-06-27 16:17
国内视频大模型发展现状 - 国内视频生成大模型行业高开低走,目前处于不温不火状态,主要原因是用户更偏好真人博主出演的短视频而非AI生成内容 [2] - 腾讯混元、快手可灵、字节跳动即梦等国内视频大模型各自拥有独特技术优势:可灵擅长图像识别转换、即梦强于自然语言处理、混元结合两者优点并增加自定义选项 [2] - 可灵AI经过一年发展,在影视、短剧、广告、游戏、高校教育等行业实现深度实践探索 [2] 可灵AI商业化进展 - 截至2025年4月,可灵AI全球用户突破2200万,月活增长25倍,累计生成1.68亿个视频及3.44亿张图片 [3] - 可灵系列模型占据全球AI视频工具市场30.7%访问量份额,在文生视频、图生视频赛道稳居全球前二 [3] - 可灵2.0大师版显著提升语义响应、动态质量和画面美学,新增多模态视频编辑功能 [3] - 商业化变现至2025年2月累计营收超1亿元,2025年3月年化收入运行率突破1亿美元,4-5月单月付费均超1亿元 [4] - 专业用户(P端)付费订阅贡献70%营收,这类用户兼具传播属性和付费能力 [4] 国际竞争格局 - OpenAI Sora支持60秒高质量视频生成,采用创新"视频作为图像补码"方法,但对GPU算力要求高导致延迟较长 [5] - Meta Movie Gen擅长社交媒体视频样式,优化移动端性能并具有电影级审美,但动作连贯性有待提升 [5] - RunwayML Gen-4 Alpha专注10-20秒短视频高保真合成,提供丰富编辑功能,更受创意行业青睐 [6] 其他国内厂商技术特点 - 阿里通义万相2.1增强时空上下文建模,支持无限长1080P视频,首创中文文字视频生成功能 [6] - 腾讯混元可生成5秒内2K短视频,在文本一致性、运动质量和画面质量维度领先 [6] - 百度"文心一言"4.0的"一镜流影"插件主打批量化720p短视频生产,整合进大模型生态提高用户可及性 [7] - 字节跳动即梦AI可生成2分钟1080p视频,擅长复杂运动描绘,但内容互动量呈现高开低走趋势 [7] 行业未来发展趋势 - 视频大模型将向智能化、个性化方向发展,提升复杂内容生成能力和定制化服务水平 [8] - 5G等高速网络技术普及将改善视频传输体验,进一步推动行业应用 [8]
一键生成多场景广告视频! Meta(META.US)重磅升级AI数字广告工具
智通财经网· 2025-06-17 23:13
Meta AI广告工具升级 - 公司推出升级版图像转视频广告功能,允许广告商上传最多20张图片生成定制化动态视频广告,AI系统自动配乐并叠加文字 [1] - 新工具与戛纳国际创意节同步发布,基于Llama系列大模型,旨在降低广告制作成本并简化流程 [1] - 此前已推出文本生成广告图片功能(2023年5月)和图像转AI生成GIF工具(2024年10月) [1] - 同时更新面向消费者的文本转视频工具"Movie Gen",该工具于2023年秋季首次上线 [1] Meta的AI战略布局 - 自2023年起将人工智能列为头号优先事项,与OpenAI、谷歌、微软等竞争开发大模型 [2] - 近期以143亿美元投资Scale AI获取49%股权,后者估值超290亿美元 [3] - Scale AI CEO将加入Meta核心团队,领导通用人工智能"超级智能"团队 [3] - 此次投资可能加速Meta AI应用整合及变现,优化数据标注改进自有模型 [3] - 与Scale AI在Defense Llama项目上已有合作,涉及国防军事应用 [3] 投资Scale AI的战略意义 - Scale AI作为全球数据标注与模型评测龙头,掌握AI时代关键数据资源 [4] - 将帮助Meta完善AI生态三位一体:算力(英伟达GPU+自研ASIC+数据中心)、大模型(Llama系列)、数据(Scale AI) [4] - 被视为Meta构建"AI护城河"的最后关键拼图 [4] - 有望推动Llama系列大模型商业化,将Meta AI深度嵌入社交、广告与硬件生态 [4] 数字广告业务协同效应 - 数字广告是核心创收引擎,30亿用户为基础 [3] - AI广告工具已连续多季度推动广告营收超预期增长 [3] - 开源大模型及生成式AI工具帮助广告商扩大潜在用户覆盖 [3] - 为广告商和用户提供基于AI的全新广告推荐体验,被华尔街视为股价持续上涨的重要逻辑 [3]
AI成广告业务重点,消息称Meta正测试AI自动生成视频广告
环球网· 2025-06-17 17:04
Meta AI广告技术进展 - Meta升级图像转视频广告工具 允许营销人员利用AI将产品图片转化为多场景视频广告 最多可上传20张图片并添加背景音乐和文本 [3] - Meta首席执行官马克・扎克伯格将AI列为2024年公司首要任务 与OpenAI 谷歌和微软等竞争对手展开AI模型及消费者功能竞赛 [3] - Meta本月向Scale AI投资143亿美元(约1027亿元人民币) 并组建专注于"超级智能"AI的团队 [3] - AI广告业务已成为Meta关键战略重点 该业务占公司年收入的98% [3] - Meta此前已推出文本创建广告图功能 2023年10月推出图片转AI动图广告功能 目前正在开发面向普通消费者的Movie Gen文本转视频工具 [3] TikTok AI广告工具布局 - TikTok推出新AI广告工具 包括广告视频生成功能 允许广告商上传商品图片或文字提示生成5秒短视频 [4] - 文字与图片转视频功能属于TikTok 2024年推出的"Symphony"产品系列 该工具旨在帮助品牌利用生成式AI制作广告 [4] - TikTok此前已允许广告商通过AI数字人在平台内推广和销售产品 [4] 行业动态 - 科技巨头Meta和短视频平台TikTok同期推进AI自动生成视频广告功能 显示行业对AI广告技术的集中投入 [1][3][4] - AI生成广告技术正成为数字营销领域重要发展方向 主要平台通过降低广告制作成本吸引中小广告主 [3][4]
CVPR 2025 Tutorial:从视频生成到世界模型 | MMLab@NTU团队&快手可灵等联合呈现
量子位· 2025-06-05 16:32
MMLab@NTU团队 投稿 量子位 | 公众号 QbitAI 图像生成已经"卷"入日常,视频生成也不再是最初的"抖动幻影",而是跃升为能够讲故事、控制动作、进行较长时推理的高质量动态内容。 视频生成是否能成为通往世界模型的桥梁? 它是否具备成为可执行、可交互、可推理的智能中枢? 它是否正在走向支撑具身智能(Embodied Intelligence)的核心能力? 这些问题将在 CVPR 2025 Tutorial 《From Video Generation to World Models – 从视频生成到世界模型》中深入探讨。 如何将视频生成作为强大的视觉先验,赋能 AI 感知世界、理解交互、推理物理,从而迈向更通用、更具具身智能能力的世界模型。 本Tutorial(教程)汇聚来自学术界与产业界的一线研究者: 他们将在生成建模、3D理解、强化学习与物理推理等方向展开分享,探讨如何将生成能力转化为感知、预测与决策的智能基座。 日程安排一览(CVPR 2025 |6 月 11 日) | Time (GMT-5) | Programme | | --- | --- | | 09:20 - 09:30 | Ope ...