Workflow
AI生成视频
icon
搜索文档
可灵VS即梦:初探“多模态”
钛媒体APP· 2025-09-11 13:33
AI视频生成平台技术路线 - 国内AI视频生成领域以可灵和即梦为主要平台 [1] - 文生图+图生视频路线具有更高可控性 而文生视频路线能提供更强动态感 [3] - 多数用户选择可控性优先的技术路径 [4] AI内容生成能力评估 - AI编剧能力表现突出 Gemini 2 5 Pro能生成专业级分镜头脚本 [7][8] - 文生图能力存在局限 腾讯混元模型部分生成结果不符合指令要求 [13][15] - 图生视频指令系统成熟 涵盖场景 动作 运镜 风格等专业要素 [9] 视频生成技术缺陷 - 指令遵循度不足 平台经常偏离用户输入的明确指令 [20][22] - 物理逻辑错误频发 包括穿模现象和不合理运动轨迹 [24][25][28] - 时间一致性差 5秒内视频主体可能出现显著变化 [32][34] 平台性能对比分析 - 可灵平台优势体现在物理模拟真实性和动态感表现 [36] - 可灵具备深度概念理解能力和艺术诠释能力 [36] - 可灵掌握复杂镜头语言 能完成推拉变焦等专业运镜 [37] - 即梦平台优势在于图像保真度和稳定性 [43][44] - 即梦对复杂构图指令执行更可靠 但物理真实感不足 [46][47] - 即梦镜头语言能力较弱 难以完成复杂电影运镜 [48] 行业技术瓶颈 - 视频时长限制显著 主流平台仅支持5-10秒视频生成 [52] - 保真度与创意性存在技术路线博弈 尚未实现兼顾 [50] - 长时长连贯视频生成仍是重大技术挑战 [53] 商业化成本结构 - 基础生成成本较高 即梦平台最低配置为1元/5秒视频 [59] - 可灵平台标准模式定价为2元/5秒视频 [59] - 高质量视频需要多次调试 实际使用成本持续增加 [60] - 本地部署和模型微调成本超出一般用户承受能力 [57]
大行评级|里昂:预计快手第二季度将实现稳健增长 目标价上调至83港元
格隆汇· 2025-08-19 12:04
快手第二季度业绩预测 - 预计第二季度在线营销收入按年增长12%至197亿元 [1] - 经调整EBIT按年增长15%至50亿元 [1] - GMV预计按年稳定增长13.5% 得益于货架模式电商扩张和以旧换新政策推动 [1] 可灵业务表现 - 可灵第二季收入料为3亿元 增长超预期 [1] - 高质量AI生成视频和极具竞争力的价格吸引全球专业用户 成为新收入驱动力 [1] 目标价调整 - 基于可灵推出和电商适度增长 目标价从67港元上调至83港元 [1] - 维持"跑赢大市"评级 [1]
“魅KTV”AI生成抽象MV引争议 视频惊现骷髅或仓鼠头人
犀牛财经· 2025-08-12 10:52
据极目新闻报道,多名网友近日发文吐槽,自己在魅KTV门店唱歌时,系统会播放抽象的AI视频,却不见原唱MV。 部分AI生成的画面逻辑混乱,曝光帖中涉及不少热门歌曲,例如播放《一笑倾城》时,视频显示雪糕快速变成人,随即又幻化成人 身仓鼠头;播放《爱错》是外国女子紧贴猫头鹰;播放《后来》是骷髅头的画面。 魅KTV工作人员表示,目前该公司主推的是AI系统。如果客人不喜欢AI版MV,可以操作切换为原唱MV,"曲库里能点的歌都是有 版权的,有原唱MV。这个AI是随机配的,AI视频相关问题,会进行反馈"。 公开资料显示,魅KTV母公司为江西爱魅文化科技有限公司,成立于2017年,2021年获得了红杉中国的A轮融资。今年3月,该公司 宣布启动港股上市计划,引发资本市场热议。 ...
字节、快手决战AI
36氪· 2025-08-12 08:56
行业竞争格局 - AI生成视频赛道竞争激烈,主要参与者包括快手的可灵AI、字节跳动的即梦AI、Minimax的海螺AI和Vidu等,各自具备独特技术优势 [16] - 专业创作者通常综合使用多个平台,尚无单一平台能完全替代其他家 [7][16] - 行业处于快速发展阶段,技术迭代迅速,高清化视频和更精准的多人物参考能力成为期待功能 [7] 快手可灵AI技术优势 - 采用类Sora技术路线,以DiT架构为基础,自研3D VAE和3D时空联合注意力机制,实现时空同步压缩 [3] - 生成视频分辨率达1080p,帧率30fps,具备电影级画面质感、高频运动节奏感和视频一致性 [3][6] - 新增多模态编辑功能,支持用户直接删除或替换视频元素,提高生成视频的可控性 [6] - 在物理引擎方面表现突出,对真实世界模拟更逼真,受到影视专业用户青睐 [6][7] 字节即梦AI技术特点 - 以自研Seedance 1.0系列模型为基础,生成多镜头无缝切换的1080p高品质视频 [3] - 通过统一预训练框架提高原生多镜头叙事能力,推理加速后最快41秒生成5秒视频 [4] - 具备高级图片审美、电影级运镜功能、精准数字人对口型能力和较快生成速度 [7] - 在镜头变换角度灵活性方面优势明显,适合动漫质感创作 [7] 性能评测对比 - 在Artificial Analysis第三方评测中,即梦AI的Seedance 1.0在文生视频和图生视频任务中均位居首位 [4] - ELO评分显示:字节Seedance 1.0得1314分,谷歌Veo 3 Preview得1252分,可灵AI 2.0得1114分 [5] - 实测对比显示可灵AI 2.1在画质、动态细节连接、特效、光影和关键词理解方面表现更好 [9] - 可灵AI生成速度较慢,高峰期等待时间过长;即梦AI缺乏电影级大片质感和高精度细节 [6][7] 商业化进展 - 可灵AI年化营收(ARR)已突破1亿美元,4月和5月月度付费金额均超1亿元人民币 [13] - 可灵AI用户规模达近4500万,付费会员占比高,其中超一半为海外用户 [13] - 可灵AI APP在美国等29个国家和地区位居"图像和设计"应用下载榜第一 [13] - 即梦AI和海螺AI的ARR均未达到1000万美元 [13] - 可灵AI企业用户超1万家,提供API服务,涵盖影视公司和科技公司 [13] 定价策略 - 可灵AI 2.1版本高品质模式:5秒视频价格3.5元(35灵感值,每个灵感值0.1元),每秒成本0.7元 [10] - 即梦AI 3.0 Pro版本:5秒视频价格5元(50积分,每个积分0.1元),每秒成本1元 [10] - 可灵AI价格较之前5秒10元下降65%,性价比显著提升 [10] 用户生态 - 即梦AI月活用户数达893万,可灵AI月活为180万 [14] - 即梦AI创作社区生态更活跃,方便用户相互借鉴学习 [14] - 可灵AI海外用户占比大,专业用户付费意愿高 [13][16] - 即梦AI可深度整合剪映,支持一键分享至抖音,与红果短剧深度配合 [14] 平台战略布局 - 快手坚定执行AI战略,建设基于信任社区的AI内容与商业生态 [1] - 字节跳动生态为即梦AI提供创作-剪辑-宣传-发行商业化闭环优势 [14] - 可灵AI专注于专业用户扩张,即梦AI优先追求普通用户快速扩张 [16] - 竞争从短视频、电商、短剧延伸至AI领域,AI生成视频成为未来战略重点 [1][16]
对话快手可灵丨AI 新世界加载中,我们还能做些什么?
雪豹财经社· 2025-07-02 10:22
核心观点 - AI生成视频技术已具备一定成熟度,尤其在写实风格表达和运动表现方面表现突出,但距离高水准大银幕制作仍有差距 [7][16] - 行业处于快速迭代期,国内外巨头加速入场,可灵AI凭借高频迭代(一年22次)和综合实力保持Tier 1水平 [8][23] - AI工具在短剧、广告、游戏等领域已实现商业化应用,尤其在科幻类内容制作中可节省50%-70%成本 [7][28][29] 技术进展 - 可灵AI 2.1模型在语义遵从、运动表现(速度/自然度/物理规律符合度)等基础能力显著提升,支持高速运动与极致互动表现 [10][16] - 视频生成技术突破点包括:水流波动/动物毛发纹理的真实渲染、长镜头表情变化细腻度、二维动漫打斗动作流畅度 [3][16] - 当前技术短板集中于运动模糊、边缘模糊、群像人脸崩坏等稳定性问题,音效同步能力暂未布局 [18] 商业化表现 - 可灵AI全球用户达2200万,企业及开发者超1万,Q1营收1.5亿元(70%来自P端订阅) [8] - 定价策略激进:5秒视频3.5元(0.7元/秒),低于行业1元/秒均价 [19] - 主要落地场景:短剧大空镜/战争场面生成(成本节省50%)、宠物魔改视频、广告特效模板 [7][15][29] 行业竞争格局 - 全球视频生成赛道形成百花齐放格局:可灵与谷歌Veo分列文生视频/图生视频全球前二,Meta Movie Gen、阿里通义万相2.1、字节即梦AI等相继入场 [8] - 核心竞争力差异:谷歌Veo依托YouTube数据强化音画同步,可灵聚焦基础模型迭代与创作者生态建设 [18][20] - 行业仍处早期阶段,技术迭代、创作者生态搭建、商业化路径探索为共同挑战 [8][24] 应用前景 - 科幻/魔幻类内容降本效果最显著,可达传统制作成本的1/50-1/2,现实主义题材因观众敏感度较高应用受限 [29][31] - 动画制作效率提升至传统工时的1/3,资金成本降低至1/2以下 [7][32] - 未来方向包括简化创作流程、强化多模态融合、拓展C端用户破圈 [15][17]
可灵2.1刚刚上线,价格降了65%,更快、更听话、也更强。
数字生命卡兹克· 2025-05-29 11:42
产品更新 - 可灵2.1正式上线,包含专业模式(Professional Mode)和大师版(Master)两个版本,专业模式在效果和速度上优于前代且价格更低,大师版则定位更高端但价格更贵 [2] - 可灵2.1专业模式在大多数场景下已足够使用,尤其适合抓拍风格视频,而大师版更适合动作场景和专业影视制作 [2] - 可灵2.1高品质版在部分效果上可媲美2.0大师版,同时价格降低65%,适合日常使用 [10] 产品分层与定价 - 可灵建立了三个明确的质量体系:标准版(720P,20灵感值)、高品质版(1080P,35灵感值)、大师版(1080P,100灵感值) [10] - 可灵2.0大师版定价较高,5秒视频需100灵感值(10元),10秒需200灵感值(20元) [7] - 可灵2.1高品质版定价35灵感值(3.5元),相比大师版大幅降低,更具性价比 [10] 性能对比 - 生成速度:可灵1.6和2.1均在1分钟内完成,而2.0大师版和2.1大师版需3分多钟 [18] - 效果对比:在机器人弹钢琴场景中,2.1高品质版在运镜和动作上优于1.6和2.0大师版,仅结尾出现小BUG [14] - 运动表现:在车辆飞跃场景中,2.1大师版表现最佳,灰尘弥漫效果和二次飞跃细节突出 [19] - 细节处理:在机器人打拳场景中,2.1版本动作更自然,2.0大师版动作略显怪异 [20] 产品定位 - 可灵2.1高品质版适合短视频、营销广告和AI短剧等大多数日常创作需求 [27] - 可灵2.1大师版定位专业影视级制作和商业交付,在运动表现和模型质量上有更高上限 [28] - 可灵2.1不支持文生视频,仅支持图生视频,而大师版无此限制 [10] 行业影响 - 可灵2.1的推出将价格拉回亲民区间,降低了AI视频生成的门槛 [28] - 产品分层策略让不同类型创作者能在预算和效果间找到平衡,扩大用户覆盖范围 [28] - 此次更新标志着AI视频生成技术开始针对不同需求进行专业化细分 [28]
短短30秒,颠覆整个行业
混沌学园· 2025-05-06 19:17
AI视频技术突破 - AI视频技术已实现从"技术炫技"到"商业落地"的跨越,关键在于生成内容能让人"信以为真"[11] - 可灵2.0和Sora代表当前最高水平,前者已具备商用能力,后者展示未来可能性[3] - 技术突破体现在四个协同层面:语义准确理解、镜头语言自然、物理动作真实、表演可信沉浸[13] 内容生产逻辑重构 - 创作者角色从剪辑工转变为故事导演,通过prompt即可完成短片创作[13] - 制作成本断崖式下降至传统方式的5%-10%,周期缩短至几分钟[14] - 这不仅是工具升级,更是表达范式的跃迁,解放了内容想象力[14] 行业应用场景 - 广告创意领域:实现从产品概念到视觉脚本的快速转换[16] - 教育培训:构建虚拟博物馆、重现历史事件等沉浸教学场景[17] - IP孵化:用于故事预演和角色行为测试,提前感知受众反应[18] - 游戏开发:加速世界观PV构建和角色性格测试[20] - 电商直播:虚拟主播和产品演绎短片比硬广更具吸引力[22] 技术平台分化 - 技术驱动型平台(如Sora、Luma)侧重技术验证和品牌影响[28] - 工具平台型(如可灵、Runway)主打低门槛使用,探索订阅制等商业模式[28] - 不同平台形成风格化分工:Luma擅长空间构建,Pika偏好卡通化画面,Runway强于视觉风格控制[24] 商业化前景 - AI视频平台已形成工具化、平台化、商业化雏形[27] - 可能成为内容供给链的"底层引擎",类似剪映之于抖音的关系[28] - 正在探索"内容即服务(CaaS)"模式,包括模板商城、授权内容等[28] 技术挑战 - 多人物交互仍存在技术难点[29] - 长视频中语义和光线一致性尚未解决[29] - 多模态生成未完全打通语音、图像、文字联动[29]