Workflow
MiniMax秀了波AI视频杂技:越看越惊艳,指令遵循太强了
量子位·2025-06-18 08:54

海螺AI 2.0视频生成能力 - 最新发布的MiniMax海螺2.0版本能生成复杂精致的视频效果,包括处理极端物理场景并原生支持1080P分辨率[1] - 展示案例显示模型可精准执行高难度动作指令,如"人物快速流畅地投掷刀具"和"空中杂技表演跟随镜头"[2][3][5][6] - 在超现实场景(如狮子跳火圈)中保持符合物理规律的光影变换,并能捕捉火星飞舞等细节[11][13][14] 技术性能与行业地位 - 海螺2.0在AI视频竞技场图生视频排行榜位列第二,ELO评分1314,超过Google Veo 3 Preview(1240)和Runway Gen 4(1119)[23][24] - 模型在指令遵循、生成质量和成本效率方面达到一流水平,网页端和APP端均已支持该版本[8][17][19] 底层架构创新 - 公司推出全球首个开源大规模混合架构推理模型MiniMax-M1,支持100万token输入(DeepSeek R1的8倍)和8万token输出(超越Gemini 2.5 Pro)[25] - 独创闪电注意力机制使8万token深度推理仅需DeepSeek R1约30%算力,10万token推理算力消耗仅为竞品的25%[26][27] - 强化学习算法CISPO比字节DAPO等算法收敛速度快1倍,整个强化学习阶段仅消耗512块H800三周时间,成本53.47万美元[27] 研发战略方向 - 公司在视频生成和长上下文推理领域连续突破,显示其基础模型创新能力持续强化[28][29] - 技术报告显示架构创新带来显著算力效率优势,支撑其在训练和推理环节的成本竞争力[26][27]