产品发布与定位 - 公司于2026年2月12日正式上线新一代文本模型MiniMax M2.5 [2] - 该产品定位为“原生Agent生产级模型” [2] - 产品发布正值行业围绕“春节档”展开密集发布与营销攻势,加入被业界称为“AI诸神之战”的竞争 [2] 模型性能与能力 - 在编程能力方面,模型在权威榜单SWE-Bench Verified得分为80.2%,在Multi-SWE-Bench得分为51.3%,较上一代显著提升 [2] - 在Multi-SWE-Bench等多语言复杂环境中超越Opus4.6,达到了行业最好的水平 [2] - 模型展现出“原生Spec能力”,在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式 [2] - 在工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项Agent任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20%,达到了行业顶尖水平 [3] - 在办公场景中,在Word、PPT、Excel金融建模等Workspace高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比中取得了59.0%的平均胜率 [3] 产品上线与市场反响 - MiniMax M2.5已于2月12日在MiniMax Agent上线,并于2月13日全球开源支持本地化部署 [3] - 产品上线不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且仍在快速增长 [3] 公司战略与行业展望 - 公司希望在持续提升模型能力的同时,构建一个可持续扩展的Agent生态—Agent Universe [3] - 公司展望当模型能力、泛化性和成本都不再是瓶颈,Agent将渗透到工作和生活的各个角落,从编程、办公到创作、娱乐,大幅促进Agentic应用的进一步发展 [3]
MiniMax官宣参战“春节档” 新一代文本模型性能持续提升
证券日报·2026-02-13 14:45