霸榜全球大模型，MiniMax凭什么力压Claude、GPT？

文章核心观点 - 2026年，大模型的竞争焦点已从传统的聊天、推理能力转向对Agent（智能体）工作流的支持，评判标准变为谁更适合集成到Agent、谁能降低成本、谁能让开发者和企业真正用起来[54][55] - MiniMax的M2.5模型凭借对Agent场景的针对性优化、极致的性价比以及精准的市场时机（如OpenClaw框架爆发），成功获得全球开发者“用脚投票”，连续霸榜全球大模型周调用量第一[6][9][16][26][27] - 模型的成功调用量能否转化为可持续的商业优势，关键在于能否将短期热度沉淀为“Agent默认选项”并构建可收费的商业闭环，而MiniMax已通过其多元化的收入结构和国际化的市场表现展示了这种潜力[37][48][50][51] 大模型行业竞争格局与趋势变化 - 竞争焦点转移：行业正从比拼聊天、问答、写作等通用能力，转向比拼对Agent（智能体）场景的支持能力，即模型能否自主完成搜索、调工具、改代码、读网页、写文档、跑流程等长工作流任务[17][18][29] - 评判标准现实化：市场的新标准是模型是否适合接入Agent、能否将成本降下来、以及能否让开发者和企业真正用起来，比赛规则变为“谁更早把未来做成生意”[54][55] - 竞争加剧：围绕Agent的模型混战已开始加速，众多竞争者如Step 3.5 Flash、Gemini 3 Flash Preview、DeepSeek V3.2、Claude Opus 4.6等均在拼命追赶，通过免费策略或优化工作流能力争夺同一批用户[34][35][36] MiniMax M2.5模型的市场表现与成功原因 - 市场表现：自2026年2月12日发布后一个月内，MiniMax M2.5始终居于OpenRouter全球大模型周调用量排行榜第一，调用量达8.43T tokens[6][7] - 极致性价比：模型定价极具竞争力，输入为0.27美元/百万Token，输出为0.95美元/百万Token，远低于Claude Opus 4.6（输入5美元/百万Token，输出25美元/百万Token），在需要多轮调用的Agent场景中成本优势被成倍放大[12][13][14][22] - 产品定位精准：M2.5并非为“聊天”设计，而是专为编程、工具使用、搜索、办公等真实工作流打造，采用MoE架构，具有推理速度快、延迟低、197K长上下文窗口等特点，完美匹配Agent长工作流需求[16][21] - 抓住市场时机：模型发布正值开源Agent框架OpenClaw爆发，公司官方迅速上线相关教程并被OpenClaw文档列为推荐模型，从而直接吃到了OpenClaw爆发的红利，OpenClaw是其月调用量最大的单一应用贡献者之一[24][25][26][27] - 开发者口碑：在Reddit和LocalLLaMA社区获得开发者好评，被认为在工具调用和多步工作流上表现优秀，且性价比高[23] MiniMax公司的竞争优势与商业潜力 - 先发与迭代优势：在行业押注Agent的共识下，公司因押对方向而具备先发优势；模型迭代速度快，从2025年12月的M2.1迭代至2026年2月的M2.5，速度快于Anthropic、OpenAI、Google等海外巨头，并持续向Agent密集场景打磨[29][30][32][33] - 用户粘性潜力：一旦开发者围绕M2.5构建了完整的工作流（包括prompt、工具调用、长上下文处理等），切换模型的迁移成本和账单重算成本很高，这有助于将调用量沉淀为“Agent默认选项”[30][31][37] - 已验证的商业化能力：公司已证明大模型未必只能在“收入增长”和“大幅亏损”间二选一，2025年收入同比增长158.9%至7904万美元，经调整净亏损同比仅增2.7%至2.509亿美元，毛利率从12.2%提升至25.4%，经营效率改善早于同行[41][42][44] - 多元化且国际化的收入结构：收入不依赖单一模型或App - AI-native products（如海螺AI、Talkie）2025年收入约5310万美元，占比约2/3[46] - Open Platform及其他企业服务（模型API、开放平台等）2025年收入约2596万美元，占比约1/3[47] - 70%以上收入来自国际市场，2025年增长很大程度上源于中国以外的销售[51] - 增长加速迹象：M2.5模型带动业务加速，2026年前两个月模型调用量与新增用户规模跃升，M2系列文本模型在2026年2月的平均单日Token消耗量较2025年12月增长6倍以上[49] - 资本市场认可：2026年3月10日收盘，公司市值首次超过百度[53] 主要竞争对手动态 - Step 3.5 Flash (阶跃星辰)：以免费策略形成强大杀伤力，尤其吸引处于试验期的开发者和团队，调用量迅速抬升，周调用量达2.38T tokens，增长12424%[7][36] - Gemini 3 Flash Preview (Google)：周调用量4.04T tokens，增长156%[7] - Kimi K2.5 (Moonshot AI)：定位与M2.5类似，专注于复杂工作流、工具调用和长链路任务，争夺Agent/研究/编程用户，周调用量3.79T tokens，增长1119%[7][36] - DeepSeek V3.2：周调用量3.45T tokens，增长166%[7] - Claude Opus 4.6 (Anthropic)：周调用量2.86T tokens，增长11331%[7]