1美元时薪?这才是打工人的「梦中情模」
机器之心·2026-02-13 12:19

行业背景与痛点 - Anthropic发布Claude Opus 4.6模型,其“极速版”的每百万输出Token成本从25美元飙升至150美元,涨幅达6倍,高昂的“生产力税”引发了开发者的“智力焦虑”[1] - 顶级AI模型的高昂溢价正在制造隐形的技术分层,预算决定了AI助理的性能是“满血”还是“残血”,高智力与高性价比难以兼得[1][47] MiniMax M2.5模型的核心竞争力 - 模型在多语言任务Multi-SWE-Bench上拿下行业第一,在SWE-Bench Verified评测集上,基于Droid和OpenCode的实战测试通过率分别为79.7%和76.1%,双双反超Claude Opus 4.6[2] - 在BrowseComp、Wide Search等搜索和工具调用榜单评测中,M2.5达到行业顶尖水平[4] - 模型参数量仅为10B,是第一梯队中参数规模最小的旗舰模型,易于私有化部署[8] - 模型吞吐量可达100 TPS,推理速度是Claude Opus 4.6的2倍,在SWE-Bench Verified测试中,端到端任务运行耗时从平均31.3分钟减少到22.8分钟[13] 实际应用与性能表现 - 在MiniMax内部业务场景中,整体任务的30%由M2.5自主完成;在编程场景中,M2.5生成的代码已占新提交代码的80%[6] - 在内部Cowork Agent评测(GDPval-MM)中,M2.5在Word排版、Excel金融建模等高阶场景下,对主流模型取得了59.0%的平均胜率[6] - 模型具备“架构师思维”,能原生Spec行为,在动手编码前会先像资深架构师一样做规划,主动拆解功能、结构和UI[26] - 在处理数十万Token的圆桌论坛速记文件提炼任务时,模型在15分钟内完成并输出高质量报告[22][23] - 在将docx文档转换为Obsidian规范的Markdown文件,并提取特定人物相关选题的任务中,整个过程耗时不到1分钟[34] 定价策略与成本优势 - 模型定价极具颠覆性:在每秒输出100个token的情况下,连续工作一小时仅需1美元;在每秒输出50个token的情况下,仅需0.3美元[13] - 换算下来,1万美元可以让4个Agent连续工作一年,极大地降低了使用门槛,实现了“Agent自由”[14] 技术架构与迭代效率 - 模型迭代速度极快,在过去108天里,MiniMax陆续更新了M2、M2.1和M2.5三个版本[39] - 其背后的核心是原生Agent RL框架Forge,该框架通过引入中间层完全解耦了底层训推引擎与Agent,使模型能力不被绑定在具体产品上,实现更强泛化[43] - 引入了过程奖励机制,对生成质量进行全链路监控,并将任务完成耗时纳入奖励函数,在智能度与响应速度间实现可量化的最优权衡[44] - 通过将多条前缀相同的样本合并为前缀树的工程优化,实现了约40倍的训练加速[45] 市场影响与行业意义 - M2.5的表现卓越,为刚上市一个多月的MiniMax公司股价带来了一波强劲上涨[9] - 模型凭借轻巧规模承载了同级别的旗舰智力,不仅是当前市场的性价比标杆,更是将高阶智能从“奢侈品”拉回到了“生产力工具”的范畴[47] - 结合MiniMax发布的桌面端Agent,一个可本地部署的超强大脑与功能完善的脚手架强强联合,有望成为白领与程序员手中随时待命的“主力机”[48] - 这体现了公司“服务普通人的AI”和“Intelligence with Everyone”的理念,推动了顶级智力的全民普惠,成为社会生产力提升的动力[48][49]

1美元时薪?这才是打工人的「梦中情模」 - Reportify