刚刚,霸榜神秘视频模型身份揭晓,原来它就是「David」
机器之心·2025-12-02 08:17

产品发布与市场地位 - Runway公司最新发布Gen-4.5视频生成模型,该模型即此前在Artificial Analysis榜单上排名第一的神秘模型Whisper Thunder (aka) David [1] - Gen-4.5在视频生成的运动质量、提示词遵循度以及视觉逼真度方面树立了全新的行业标准 [1] - 该模型是目前全球评价最高的视频生成模型,其ELO Score分数为1,247,超越了Google的Veo 3/3.1(1,226/1,223分)、Kling 2.5(1,225分)以及OpenAI的Sora 2 Pro(1,206分)等主要竞争对手 [3][6] 技术特性与性能突破 - 模型在动态可控的动作生成、时间一致性以及多种生成模式下的精确可控性方面树立了新行业标准 [8] - 具备精确的提示词遵循能力,物体的运动呈现真实的重量、动量与力感,液体流动符合正确的动力学特性,表面细节以高保真度呈现 [11] - 能够生成复杂场景,以高精度呈现结构精巧、元素丰富的多层次场景 [11] - 具备精细的构图能力,能对物体与角色进行精确定位并呈现流畅自然运动效果 [13] - 模型呈现富有表现力的角色,能够展示细腻的情感、自然流畅的肢体动作以及栩栩如生的面部细节 [14] - 覆盖广泛的美学风格,从照片级真实感、电影质感到风格化动画,同时保持统一连贯的视觉语言 [16] 技术架构与部署 - Gen-4.5基于NVIDIA架构构建,在整个流程(包括早期研发、预训练、后训练及推理阶段)均完全运行于NVIDIA GPU之上 [20] - 公司与NVIDIA深度合作,从训练效率到推理速度全方位推动视频扩散模型优化的技术边界 [20] - 推理运行在NVIDIA Hopper和Blackwell系列GPU上,在保证质量的同时实现性能最优化 [20] 行业发展与公司历程 - Runway于2023年2月发布Gen-1,这是首个面向公众的视频生成模型,开创了全新的创意表达方式并催生了新产品类别 [7] - 2023年7月发布的Gen-2率先支持文生视频和图生视频功能,比PIKA和Sora都要早 [7] - 公司不断引领行业,让视频模型变得更强大、更可控,从基础模型的大幅提升到全新的控制方式以及更广泛的上下文能力 [7]