MiniMax官宣参战“春节档” 编程模型MiniMaxM2.5上线
新华网财经·2026-02-13 17:31
MiniMax发布新一代文本模型M2.5 - 公司于2026年春节前夕正式上线新一代文本模型MiniMax M2.5 [2] - 模型在编程能力方面取得显著提升,在权威榜单SWE-Bench Verified得分80.2%,在Multi-SWE-Bench得分51.3% [2] - 在Multi-SWE-Bench等多语言复杂环境中,模型表现超越Opus4.6 [2] - 模型展现出“原生Spec能力”,在编码前能主动拆解架构与功能规划,更接近真实架构师的工作模式 [2] 模型在工具调用与办公场景能力 - 在工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、WideSearch等多项Agent任务中以更低的轮次消耗取得更优效果 [4] - 相较于上一代模型,在Agent任务中的表现提升20% [4] - 在办公场景中,模型在Word、PPT、Excel金融建模等Workspace高阶场景能力显著提升 [4] - 在测评框架GDPval-MM与主流模型的对比中,模型取得了59.0%的平均胜率 [4] 模型的推理速度与成本优势 - M2.5-lightning版本支持100 TPS以上的输出速度,是主流模型的2倍左右 [4] - 模型的输入价格约为0.3美元/百万Token,输出价格约为2.4美元/百万Token [4] - 按每秒输出100 Token计算,M2.5连续运行一小时成本约1美元;若按每秒50 Token计算,成本约0.3美元 [4] - 公司认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化 [4]