昆仑万维开源的SkyReels-V3,把马斯克请来带货了

AI虚拟网红与视频生成行业现状 - AI生成的虚拟网红在社交平台上已获得广泛关注,手握品牌合作并坐拥百万粉丝,许多用户并未意识到其并非真人,依然进行互动、点赞和消费[1] - 有行业观点认为虚拟网红时代已经到来[2] SkyReels-V3模型开源事件与核心能力 - 昆仑万维旗下Skywork AI团队于1月29日宣布开源SkyReels-V3多模态视频生成模型系列[3] - 该模型系列在单一建模架构中集成了三大核心能力:参考图像转视频、视频延长和音频驱动虚拟形象,达到业界领先水平[3] - 模型完全开源,旨在让任何有想法的创作者都能快速搭建自己的虚拟IP,甚至批量生产内容矩阵[9] 参考图像转视频功能详解 - 功能允许用户上传1-4张参考图像,配合文本提示词,生成时间连贯、语义一致的视频,并精准保留身份特征与空间构图[11] - 在电商场景测试中,上传马斯克照片和小象玩偶图,能生成面部特征高度一致、动作自然流畅、商品展示角度恰当的视频[12][15] - 上传手袋商品图和模特照,能生成模特在都市夜景中展示产品细节的视频,人物动作优雅,构图专业[17][19] - 模型能同时处理多张不同参考图,精准还原人物特征并保证风格统一,例如生成《怪奇物语》演员在上海外滩自拍的互动视频[20][22][23][24] 视频延长功能详解 - 功能可将输入视频片段延伸为更长内容,保持运动动态、场景结构和视觉风格一致性,支持单镜头延长和镜头切换延长两种模式[26] - 单镜头延长模式下,能处理如“女孩笑着笑着突然严肃起来”的微表情过渡,保持面部特征、光影效果和视觉风格不走样[27][29] - 镜头切换延长模式支持切入、切出、多角度、正反打、切离五种专业转场,能理解如“Close-up”等专业摄影术语,增强画面张力[31][32] 虚拟形象模型功能详解 - 功能可从单张肖像图和音频片段生成音视频同步的视频,支持分钟级长度和多角色交互[34] - 基础单角色测试中,上传肖像照配音乐片段,能生成唇形与音频完全同步的唱歌MV,并保持画面稳定[35] - 模型泛化能力出色,能处理真实人物、卡通角色等不同风格[36] - 在多人物互动场景测试中,能自动识别图片形象,精准控制每个角色的开口时机,避免口型不同步的问题[37][38] SkyReels-V3核心技术解读 - 参考图像转视频功能建立在三层技术创新之上:数据构建层面从海量高质量视频中筛选动态素材并采用跨帧配对策略;利用图像编辑模型避免“复制粘贴”伪影;采用统一的多参考条件策略,支持最多4张参考图像的灵活组合[41][42] - 训练策略采用图像-视频混合训练方案,通过多分辨率联合优化提升对不同空间尺度和宽高比的鲁棒性[43] - 在涵盖电影电视、电商、广告等场景的200对混合测试集上,模型在参考一致性和视觉质量方面均处于国内领先位置[44] - 视频延长模块核心创新在于双模式延长机制设计,并开发了专门的镜头切换检测器自动分析转场类型[45] - 技术实现采用统一的多分段位置编码方案支持复杂运动建模,并通过分层混合训练实现平滑镜头切换[45] - 该模块支持480p和720p分辨率,单镜头延长可调节5至30秒长度,并支持多种宽高比[46] - 虚拟形象模型采用音视频精准对齐和关键帧约束生成机制,通过区域掩码建模实现语音与面部运动的对应关系[47][48] - 整体架构采用模块化设计,三大功能模块可独立使用或灵活组合,并通过企业级数据处理管线确保质量稳定[49] - 推理端融合了蒸馏、量化及算子优化等技术,打造出低延迟、高吞吐的推理引擎[49] - 训练效率方面采用了极致的显存与计算优化方案,支撑高分辨率长视频的千卡级稳定高效训练[50] 昆仑万维的技术积累与行业竞争 - SkyReels-V3的开源反映了AI视频生成领域的竞争态势,国内团队通过开源策略快速建立生态、获取反馈、迭代优化[51][52] - 昆仑万维在视频生成领域有长期技术积累:2025年2月开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1及SOTA级别表情动作可控算法SkyReels-A1;4月发布全球首个使用扩散强迫框架的无限时长电影生成模型SkyReels-V2;随后推出可控视频生成框架SkyReels-A2和任意时长全模态音频驱动数字人创作模型SkyReels-A3[53] - 迭代速度和技术深度显著[54] - 昆仑天工自研了包括语言大模型、多模态大模型、SWE代码大模型、Agent大模型、视频大模型、3D大模型、音乐大模型、音频大模型在内的8大模型矩阵,并持续开源几十个模型,在多个国际评测中取得开源最优成绩[54] - 视频模型是连接文本、图像、音频等多模态能力的关键节点[55] - 此次开源预示着AI视频生成的竞争正在进入更激烈的阶段,技术壁垒逐渐被打破[56]

昆仑万维开源的SkyReels-V3,把马斯克请来带货了 - Reportify