深度 | 108天狂奔:M2.5之后,AI竞争的唯一标尺是加速度
Z Potentials·2026-02-14 18:09

2026 年的春节档,成为了 AI 行业一场军备竞赛的缩影。巨头与创业公司密集发布新模型,技术迭代的周期从过去的半年一更,被无情地压缩至按月刷 新。在这个 技术领先窗口期被加速压缩的 时代,任何单一时点的 Benchmark 排名都已迅速失去意义。 行业对护城河的定义正在悄然改变。曾经,某个版本的性能优势就是坚固的壁垒,但现在,焦点正转向其背后支撑高速迭代的系统性进化能力。评估一家 AI 公司的标准,也从它现在有多强,转变为它能 以多快的速度变强 。 正是在这个背景下, MiniMax M2.5 的出现,将这个趋势以一种极端的方式摆在了台面上。 它在关键的编程能力基准 SWE-Bench Verified 上,取得了 80.2% 的成绩,几乎追平了最昂贵的对手 Claude Opus 4.6 ( 80.8% )。而实现这一切的代价, 却被压缩到了极致:在 100 TPS 的高速推理下,连续工作一小时仅需 1 美金,价格是同级模型的十分之一到二十分之一。这种极致的性能与成本组合,使 其不再只是一个简单的技术升级。 刷新多个行业 SOTA SWE-Bench Verified ( 80.2% ), Multi-S ...