噪声感知计算重分配（Noise-aware Compute Redistriburion

搜索文档

量子位· 2025-06-19 14:25

核心观点 - MiniMax发布新一代视频生成模型Hailuo 02，在物理场景理解和复杂指令执行方面表现突出，支持1080p高清输出和多种视频时长[4][15] - 该模型在体操、镜子成像等复杂物理场景中表现优异，相比早期模型违背常识的概率大幅降低[4][32][34] - 模型能够精准执行包含多要素、大跨度的复杂指令，生成效果稳定且具有纪录片质感[36][40][44][46] - 在图生视频方面，模型可直接生成可用于广告营销等商业场景的高质量视频，无需后期剪辑[56][57][59] - 模型采用噪声感知计算重分配(NCR)架构，训练和推理效率提升2.5倍，参数量达前代3倍，训练数据提升4倍[77][79][82] - 公司正构建从文本、语音到视频的全模态能力体系，技术布局覆盖基础模型和Agent等方向[86][87] 技术性能 - 原生支持1080p高清视频输出，同时提供768p选项，画面质感显著提升[4][15] - 支持6秒和10秒两种视频时长，可通过拼接延长[15] - 在Arena ELO基准测试中得分1332，超越谷歌Veo 3(1241)和快手Kling 2.0(1194)[12] - 训练效率提升2.5倍，参数量达前代3倍，训练数据规模扩大4倍[79][82] - 采用NCR架构实现降本增效，推理成本创新低[77][84] 应用场景 - 体育场景：精准生成体操运动员动作和复杂物理交互[1][2][4] - 影视特效：可生成雨滴悬停等好莱坞级特效画面[65][66][69] - 广告营销：直接生成Labubu玩偶宣传片等商业级视频[57][58] - 社交媒体：支持旅游打卡、灵魂画手等短视频玩法[61][63][50][52] - 纪录片制作：能处理四季变换等时间跨度大的专业需求[44][46] 用户体验 - 新用户赠送500免费积分，生成10秒768p视频消耗50积分[14] - 提供预设提示词库和运镜指导资源，支持AI自动优化提示词[71] - 网页和APP端同步上线，国内用户使用友好[12][13] - 生成效果稳定，相同提示词产出结果一致性高[40] 行业地位 - 视频生成能力进入全球第一梯队，部分表现超越谷歌Veo 3[11][73] - 在物理场景理解和复杂指令执行方面建立技术壁垒[22][32][52] - 国产模型中率先实现语音生成领域全球基准测试双料第一[86] - 通过技术创新持续提升性价比，重新定义行业标准[77][84]

AI视频生成

NCR）

噪声感知计算重分配（Noise-aware Compute Redistriburion

Artificial Intelligence

噪声感知计算重分配（Noise-aware Compute Redistriburion

Artificial Intelligence

Hailuo 02

MiniMax-M1