公司产品发布与性能 - MiniMax于2月13日发布最新M2.5大模型,该模型提升了智能体任务处理速度,且调用价格远低于同等级产品 [1] - M2.5完成任务的平均耗时从上一版本M2.1的31.3分钟缩短至22.8分钟,速度提升37% [1] - M2.5的任务处理耗时(22.8分钟)与Anthropic同期发布的Claude Opus 4.6模型(22.9分钟)基本持平 [1] - 在编程任务上,M2.5在BridgeBench测试中的得分仅比Opus 4.6低0.4分,但调用价格仅为后者的1/8 [1] - M2.5上线后在AI模型API聚合平台OpenRouter上的日调用量超过1000亿token,跻身平台榜单前十 [2] 产品定价与市场反馈 - M2.5定价极具竞争力,在每秒输出100个token的情况下,连续工作一小时仅需1美元;每秒输出50个token则需0.3美元 [1] - 1万美元的预算可支持4个智能体连续工作一年,公司称M2.5提供了“经济上几乎无限制地构建和运营Agent的可能性” [1] - 硅谷风投Menlo Ventures合伙人评价M2.5“超便宜,非常适合编程” [2] - 云端编程智能体平台OpenHands评价当前API模型市场是“两强争霸”,Opus代表最高能力上限,M2.5则以更低成本提供较高能力 [2] 产品应用场景与能力 - M2.5在需要长时间运行的任务上表现突出,例如从零开始构建应用程序 [2] - 除编程外,M2.5在Word、PPT、Excel金融建模等办公高阶场景的能力也取得显著提升 [2] - 公司前期与金融、法律、社会科学等领域的资深从业者深度合作,将行业隐性知识带入模型训练流程 [2] 技术进展与迭代节奏 - 在过去100多天内,MiniMax保持近乎“每月一更”的节奏,陆续推出了M2、M2.1和M2.5版本 [3] - 从编程基准测试SWE-Bench Verified的成绩看,M2系列模型的性能提升速度比Claude、GPT和Gemini等模型系列更为显著 [3] - 公司将模型能力的持续跃升归因于大规模强化学习,特别是围绕Agent RL(智能体强化学习)框架和算法搭建的完整技术体系 [3] 行业竞争态势 - M2.5的发布是国产大模型公司在春节前夕集中“交卷”的最新案例 [3] - 近期行业动态包括:字节跳动视频生成模型Seedance2.0接入豆包和即梦产品;智谱上线旗舰新模型GLM-5,同样主打编程能力;DeepSeek开始测试最高100万Token的上下文长度 [3] - 国产大模型集体“上新”引爆“AI春节档”,令全球AI竞赛更加白热化 [3]
MiniMax新模型比肩海外头部,国产大模型开启“月更”
南方都市报·2026-02-14 17:28