击败Runway和快手可灵,生数科技Vidu Q1登顶成为最强视觉大模型


模型性能表现 - Vidu Q1在VBench-1.0和VBench-2.0测评中超越Runway Gen-3、OpenAI Sora及快手Kling1.x等国内外顶尖模型 位列文生视频赛道双榜单第一 [1] - 在表面真实性维度(美学质量/对象生成/场景生成/视频语义一致性)和内在真实性维度(物理规律/常识推理)均达到SOTA水平 [1] - 国内SuperCLUE图生视频榜单中 动漫风格与写实风格双赛道均获第一 [2] 技术特性升级 - 支持生成5秒1080P高清视频 实现电影级画质与复杂场景运镜能力 [2] - 新增首尾帧功能:通过两张图片自动生成中间镜头 支持推/拉/摇/移等专业镜头语言 [2][3] - 升级动画风格动态表现力 并新增AI音效生成功能 支持多音效叠加 [2] - 可精准呈现物理变化过程(例如水转冰晶的形态变化) 替代传统专业摄像需求 [3] 商业化应用与定价 - 支持直接生成适用于动漫/短剧/电商/品牌广告的商用视频 实现"即生成即商用" [3] - 定价具备竞争力:5秒1080P视频仅需1.34元 相当于每秒0.3元 为同行价格的十分之一 [3] - 全球同步上线 无需排队或内测申请 降低使用门槛 [3] 公司背景与融资 - 核心团队源自清华大学人工智能研究院 CEO唐家渝为清华计算机系本硕 首席科学家朱军任清华人工智能研究院副院长 [4] - 2023年4月发布中国首款长时长高一致性视频大模型Vidu 被称为"中国版Sora" [4] - 已完成多轮融资 投资方包括北京市人工智能产业投资基金/中关村科学城/启明创投/蚂蚁集团/BV百度风投等机构 [4]