1美金时薪雇个全栈替身,MiniMax M2.5让打工人也能体验当老板的感觉
36氪·2026-02-13 11:13

MiniMax M2.5模型发布与核心能力 - 公司正式官宣新模型M2.5,主打智能体和Vibe Coding,性能比肩Claude Opus 4.6 [1] - 模型具备全栈代码生成能力,能从前端界面、后端逻辑到数据库设计一次性交付完整可运行项目 [1][4][5] - 模型专为智能体生态设计,配合OpenClaw等脚手架,可将自然语言指令转化为电脑上的具体操作 [1] 技术性能与基准测试 - 模型拥有100亿(10B)激活参数,属于第一梯队的旗舰模型 [2][9] - 在编程硬核榜单SWE-Bench Verified上获得80.2%的高分,在多语言任务Multi-SWE-Bench上排名第一 [2] - 推理吞吐量达到每秒100次查询(100TPS),速度是主流旗舰模型的2倍,每小时使用成本仅为1美元 [1][9][30] Vibe Coding与全栈开发能力 - 在Vibe Coding模式下,模型能通吃全栈,支持Go、Rust、Python等10多种编程语言 [5] - 模型具备“原生Spec行为”,在编码前会像架构师一样主动拆解功能结构和UI设计 [5] - 通过实际测试,模型能用Java Spring Boot成功构建一个具备WebSocket实时同步、权限控制的多人协作待办清单系统,并完成前后端部署 [18][19][27] 智能体与长链路任务处理 - 模型适配各种智能体框架,在测试中成功接入OpenClaw并完成复杂任务 [10] - 通过引入“过程奖励”(Process Reward)机制,全链路监控任务完成质量,有效解决了长任务容易“跑偏”的难题 [5] - 在实战测试中,模型能指挥智能体完成清洗100个财务文件、按规则重命名、分析数据并生成带图表的月度财务分析PPT等系列任务 [12][14][16][18] 行业影响与商业化应用前景 - 模型的出现被视为AI应用大爆发即将到来的明确信号,其代码能力在过去100多天内进步迅速,保持行业最快迭代节奏 [28] - 模型解决了“贵”和“慢”两大核心痛点,以高性价比(1美元/小时)和高速推理能力,有望成为生产力引擎而非仅仅是辅助工具 [30][33] - 在MiniMax内部,该模型已经接管了30%的真实业务,涵盖从编写代码到制作财务报表等多种任务 [33]

1美金时薪雇个全栈替身,MiniMax M2.5让打工人也能体验当老板的感觉 - Reportify