MiniMax M1推理模型

搜索文档
MiniMax的好日子来了?
虎嗅· 2025-06-18 17:41
核心观点 - MiniMax开源其首个推理模型M1,并邀请用户测试通用Agent,试图在AI Agent爆火的2025年抢占先机 [2][4] - M1模型的核心优势在于100万token输入和8万token输出的长上下文能力,以及工具调用能力,但在常规基准测试中表现中等 [6][22][29] - MiniMax的技术创新包括闪电注意力机制和CISPO强化学习算法,显著降低了训练成本至53.47万美金 [51][55][63] - 公司押注长上下文能力以适配Agent需求,但面临多维度竞争挑战 [67][71][78] 模型能力 M1推理模型 - 支持100万token输入和8万token输出,与Google Gemini 2.5 Pro并列业界第一 [52] - 在TAU-bench(Airline)测试中得分最高,长上下文处理能力处于第一梯队 [48][49] - 实际测试显示其代码生成能力完整但推理链过长,例如成功实现钢琴键盘可视化小游戏但耗时较长 [6][16][21] - 可完整翻译33页PDF并还原格式,但翻译任务非其核心优势 [22][23][28] 通用Agent - 测试案例中能完整交付OpenAI发展历程网页项目,包含信息搜集、代码生成和自检流程 [33][34][37] - 创新点在于利用浏览器测试自开发网站,提升交付质量 [37] - 整体表现中规中矩,未显著超越同类产品 [31][32][39] 技术创新 - 采用线性注意力架构的闪电注意力机制,处理100万token输入时延迟仅为传统softmax attention的1/2700 [54][55] - CISPO强化学习算法收敛速度达竞品两倍,训练成本仅53.47万美金(512块H800芯片,三周) [57][59][63] - 生成10万token的算力需求为DeepSeek R1的25%,具备成本优势 [65][66] 行业竞争与战略 - 2025年被业界视为AI Agent爆发年,MiniMax通过长上下文能力切入赛道 [4][70][71] - 公司多模态原生模型基础可支持Agent商业化,但需平衡技术优势与用户体验 [76][78] - 行业竞争焦点包括端到端学习、工具调用、多模态能力和主模型性能 [75][77]