MiniMax官宣参战“春节档” 编程模型MiniMaxM2.5上线

MiniMax发布新一代文本模型M2.5 - 公司于2026年春节前夕正式上线新一代文本模型MiniMax M2.5 [2] - 模型在编程能力方面取得显著提升，在权威榜单SWE-Bench Verified得分80.2%，在Multi-SWE-Bench得分51.3% [2] - 在Multi-SWE-Bench等多语言复杂环境中，模型表现超越Opus4.6 [2] - 模型展现出“原生Spec能力”，在编码前能主动拆解架构与功能规划，更接近真实架构师的工作模式 [2] 模型在工具调用与办公场景能力 - 在工具调用和搜索能力方面，模型能够自动处理复杂任务，在BrowseComp、WideSearch等多项Agent任务中以更低的轮次消耗取得更优效果 [4] - 相较于上一代模型，在Agent任务中的表现提升20% [4] - 在办公场景中，模型在Word、PPT、Excel金融建模等Workspace高阶场景能力显著提升 [4] - 在测评框架GDPval-MM与主流模型的对比中，模型取得了59.0%的平均胜率 [4] 模型的推理速度与成本优势 - M2.5-lightning版本支持100 TPS以上的输出速度，是主流模型的2倍左右 [4] - 模型的输入价格约为0.3美元/百万Token，输出价格约为2.4美元/百万Token [4] - 按每秒输出100 Token计算，M2.5连续运行一小时成本约1美元；若按每秒50 Token计算，成本约0.3美元 [4] - 公司认为，当性能与成本不再构成约束，Agent规模化部署的经济模型将发生根本变化 [4]