Workflow
MiniMax深夜致歉,开源大模型M2登顶引发全球热潮
第一财经·2025-10-30 15:47

模型发布与市场反响 - MiniMax发布全新模型MiniMax M2并依据MIT协议全面开源其完整权重 [1] - M2模型发布后访问量远超预期,平台一度因访问过载导致服务成功率降至约90%,经扩容后恢复至约99%的稳定水平 [4] - M2已登上OpenRouter全球调用量第5位及国内模型第1位,并位列Hugging Face Trending榜单第2位 [5] 模型性能与技术特点 - M2在权威测评榜单Artificial Analysis中取得全球第五、开源第一的成绩,其智能水平接近GPT-5(high)与Claude Sonnet 4.5等顶级模型 [7] - M2总参数约2300亿,单次激活约100亿参数,采用全注意力+MoE架构,专注于代码生成、工具调用等可执行型Agent任务 [15] - 在模型性能、推理速度与成本的综合平衡上表现突出,在'性能、速度、成本'的不可能三角中找到了平衡点 [10] 核心能力表现 - 在代理能力方面,M2能够出色地规划并执行复杂的工具链,协同调用Shell、浏览器、Python代码执行器等工具,并具备自我纠错与恢复能力 [10] - 在编程能力方面,M2具备强大的端到端开发能力,包括多代码文件处理、执行"编码-运行-调试"的完整循环 [10] - 在深度搜索能力方面,M2在Xbench-DeepSearch基准上全球前二、仅次于GPT5,在金融搜索基准FinSearchComp-global上全球前二、仅次于Grok4 [11] 产品定位与迭代路径 - 相较于前代模型M1(总参数约4560亿,激活约459亿参数)专注于长文本和复杂推理,M2完全面向Agent时代的执行任务 [12][13][14][15] - M2在设计路线上放弃了M1的混合注意力机制,选择了全注意力+MoE路线,以更好地应对Agent场景中多步骤、长链条的复杂推理 [14][15] - 公司当前将M1和M2视为平衡不同场景的两类模型:M1强调"能想很久、能读很长",M2强调"能执行、且便宜" [15] 商业模式与产品生态 - 公司维持全球范围的限时免费开放策略,为开发者提供高性能的Coding与Agent能力 [5] - M2模型的输入侧费用为每百万Token约0.30美元,输出侧为每百万Token约1.20美元,约为Claude 4.5 Sonnet价格的8% [15] - 公司自研的Agent产品已全面切换到M2模型驱动,并推出专业模式(擅长全栈开发/deep research/PPT制作)和高效模式(擅长chat问答/轻量级搜索/轻量级代码)两种模式 [16]