噪声感知计算重分配(Noise-aware Compute Redistriburion

搜索文档
嚯!国产视频模型的物理水准超神了 | 实测MiniMax海螺02
量子位· 2025-06-19 14:25
核心观点 - MiniMax发布新一代视频生成模型Hailuo 02,在物理场景理解和复杂指令执行方面表现突出,支持1080p高清输出和多种视频时长[4][15] - 该模型在体操、镜子成像等复杂物理场景中表现优异,相比早期模型违背常识的概率大幅降低[4][32][34] - 模型能够精准执行包含多要素、大跨度的复杂指令,生成效果稳定且具有纪录片质感[36][40][44][46] - 在图生视频方面,模型可直接生成可用于广告营销等商业场景的高质量视频,无需后期剪辑[56][57][59] - 模型采用噪声感知计算重分配(NCR)架构,训练和推理效率提升2.5倍,参数量达前代3倍,训练数据提升4倍[77][79][82] - 公司正构建从文本、语音到视频的全模态能力体系,技术布局覆盖基础模型和Agent等方向[86][87] 技术性能 - 原生支持1080p高清视频输出,同时提供768p选项,画面质感显著提升[4][15] - 支持6秒和10秒两种视频时长,可通过拼接延长[15] - 在Arena ELO基准测试中得分1332,超越谷歌Veo 3(1241)和快手Kling 2.0(1194)[12] - 训练效率提升2.5倍,参数量达前代3倍,训练数据规模扩大4倍[79][82] - 采用NCR架构实现降本增效,推理成本创新低[77][84] 应用场景 - 体育场景:精准生成体操运动员动作和复杂物理交互[1][2][4] - 影视特效:可生成雨滴悬停等好莱坞级特效画面[65][66][69] - 广告营销:直接生成Labubu玩偶宣传片等商业级视频[57][58] - 社交媒体:支持旅游打卡、灵魂画手等短视频玩法[61][63][50][52] - 纪录片制作:能处理四季变换等时间跨度大的专业需求[44][46] 用户体验 - 新用户赠送500免费积分,生成10秒768p视频消耗50积分[14] - 提供预设提示词库和运镜指导资源,支持AI自动优化提示词[71] - 网页和APP端同步上线,国内用户使用友好[12][13] - 生成效果稳定,相同提示词产出结果一致性高[40] 行业地位 - 视频生成能力进入全球第一梯队,部分表现超越谷歌Veo 3[11][73] - 在物理场景理解和复杂指令执行方面建立技术壁垒[22][32][52] - 国产模型中率先实现语音生成领域全球基准测试双料第一[86] - 通过技术创新持续提升性价比,重新定义行业标准[77][84]