MiniMax新模型比肩海外头部，国产大模型开启“月更”

公司产品发布与性能 - MiniMax于2月13日发布最新M2.5大模型，该模型提升了智能体任务处理速度，且调用价格远低于同等级产品 [1] - M2.5完成任务的平均耗时从上一版本M2.1的31.3分钟缩短至22.8分钟，速度提升37% [1] - M2.5的任务处理耗时（22.8分钟）与Anthropic同期发布的Claude Opus 4.6模型（22.9分钟）基本持平 [1] - 在编程任务上，M2.5在BridgeBench测试中的得分仅比Opus 4.6低0.4分，但调用价格仅为后者的1/8 [1] - M2.5上线后在AI模型API聚合平台OpenRouter上的日调用量超过1000亿token，跻身平台榜单前十 [2] 产品定价与市场反馈 - M2.5定价极具竞争力，在每秒输出100个token的情况下，连续工作一小时仅需1美元；每秒输出50个token则需0.3美元 [1] - 1万美元的预算可支持4个智能体连续工作一年，公司称M2.5提供了“经济上几乎无限制地构建和运营Agent的可能性” [1] - 硅谷风投Menlo Ventures合伙人评价M2.5“超便宜，非常适合编程” [2] - 云端编程智能体平台OpenHands评价当前API模型市场是“两强争霸”，Opus代表最高能力上限，M2.5则以更低成本提供较高能力 [2] 产品应用场景与能力 - M2.5在需要长时间运行的任务上表现突出，例如从零开始构建应用程序 [2] - 除编程外，M2.5在Word、PPT、Excel金融建模等办公高阶场景的能力也取得显著提升 [2] - 公司前期与金融、法律、社会科学等领域的资深从业者深度合作，将行业隐性知识带入模型训练流程 [2] 技术进展与迭代节奏 - 在过去100多天内，MiniMax保持近乎“每月一更”的节奏，陆续推出了M2、M2.1和M2.5版本 [3] - 从编程基准测试SWE-Bench Verified的成绩看，M2系列模型的性能提升速度比Claude、GPT和Gemini等模型系列更为显著 [3] - 公司将模型能力的持续跃升归因于大规模强化学习，特别是围绕Agent RL（智能体强化学习）框架和算法搭建的完整技术体系 [3] 行业竞争态势 - M2.5的发布是国产大模型公司在春节前夕集中“交卷”的最新案例 [3] - 近期行业动态包括：字节跳动视频生成模型Seedance2.0接入豆包和即梦产品；智谱上线旗舰新模型GLM-5，同样主打编程能力；DeepSeek开始测试最高100万Token的上下文长度 [3] - 国产大模型集体“上新”引爆“AI春节档”，令全球AI竞赛更加白热化 [3]