Workflow
ZPedia丨诺兰看了沉默,王家卫看了流泪:全球首款无限时长AI视频模型横空出世
昆仑万维昆仑万维(SZ:300418) Z Finance·2025-04-21 09:56

AI视频生成行业现状 - 当前AI视频生成工具普遍存在单视频时长限制在10秒左右、运镜效果差、角色情绪表达缺失等技术瓶颈,难以实现连贯叙事[1] - 行业陷入闭源垄断与技术停滞困境,多数产品停留在机械执行指令阶段,无法理解影视导演语言[3] - 主流模型在视觉质量、运动动态效果和高分辨率之间难以平衡,导致专业级长视频生成受阻[10] 昆仑万维Skyreels技术突破 - 推出全球首个支持无限时长的开源电影级生成模型Skyreels-V2,突破传统10秒时长限制,实现好莱坞级别"一镜到底"[6][10] - 采用扩散强迫框架将搜索空间从O(1e48)降至O(1e32),配合强化学习解决动态扭曲问题,实现物理规律级运动流畅性[12] - 构建亿级影视专业数据集,通过四阶段渐进式训练策略(概念平衡微调→运动强化学习→扩散强迫训练→高质量微调)提升性能[14] - 内置视频理解引擎SkyCaptioner-V1,能解析"王家卫风格逆光长镜头"等专业导演指令,实现情绪层次化表达[7][9] 核心技术指标表现 - 在人类评估中综合得分3.14分,指令遵循(3.15分)和一致性(3.35分)显著领先Runway-Gen3 Alpha(2.53分)等竞品[18] - 自动化测试总分83.9%,质量分84.7%,超越Hunyuan Video-13B(82.7%)和Wan2.1-14B(83.7%)[19] - 支持720p以上电影级画质输出,解决传统AI视频"塑料感"问题,实现发丝飘动、动态模糊等细节呈现[8] 商业化应用场景 - 小说创作者可将文本直接转化为分镜短剧,无需专业影视制作团队[20] - 品牌方可快速生成"赛博朋克汽车奔跑特写"等广告素材,缩短传统2-3周制作周期至即时输出[22] - 自媒体博主实现"AI日更",单人单日完成原需5人团队的工作量,自动生成字幕/封面等配套内容[23] - 提供"剧情实验室"功能,通过多版本镜头语言测试优化影视表达效果[24] 行业影响与定位 - 首次将影视工业化体系封装为可调用的模型接口,使电影制作门槛从专业团队降至个人创作者[25] - 开创AI视频生成从"工具时代"到"创作时代"的转折,推动行业竞争焦点从技术参数转向艺术表达[3] - 作为全球首个开源电影级解决方案,打破闭源垄断格局,重新定义视频生成技术标准[3][25]