文章核心观点 - 2026年,大模型的竞争焦点已从传统的聊天、推理能力转向对Agent(智能体)工作流的支持,评判标准变为谁更适合集成到Agent、谁能降低成本、谁能让开发者和企业真正用起来[54][55] - MiniMax的M2.5模型凭借对Agent场景的针对性优化、极致的性价比以及精准的市场时机(如OpenClaw框架爆发),成功获得全球开发者“用脚投票”,连续霸榜全球大模型周调用量第一[6][9][16][26][27] - 模型的成功调用量能否转化为可持续的商业优势,关键在于能否将短期热度沉淀为“Agent默认选项”并构建可收费的商业闭环,而MiniMax已通过其多元化的收入结构和国际化的市场表现展示了这种潜力[37][48][50][51] 大模型行业竞争格局与趋势变化 - 竞争焦点转移:行业正从比拼聊天、问答、写作等通用能力,转向比拼对Agent(智能体)场景的支持能力,即模型能否自主完成搜索、调工具、改代码、读网页、写文档、跑流程等长工作流任务[17][18][29] - 评判标准现实化:市场的新标准是模型是否适合接入Agent、能否将成本降下来、以及能否让开发者和企业真正用起来,比赛规则变为“谁更早把未来做成生意”[54][55] - 竞争加剧:围绕Agent的模型混战已开始加速,众多竞争者如Step 3.5 Flash、Gemini 3 Flash Preview、DeepSeek V3.2、Claude Opus 4.6等均在拼命追赶,通过免费策略或优化工作流能力争夺同一批用户[34][35][36] MiniMax M2.5模型的市场表现与成功原因 - 市场表现:自2026年2月12日发布后一个月内,MiniMax M2.5始终居于OpenRouter全球大模型周调用量排行榜第一,调用量达8.43T tokens[6][7] - 极致性价比:模型定价极具竞争力,输入为0.27美元/百万Token,输出为0.95美元/百万Token,远低于Claude Opus 4.6(输入5美元/百万Token,输出25美元/百万Token),在需要多轮调用的Agent场景中成本优势被成倍放大[12][13][14][22] - 产品定位精准:M2.5并非为“聊天”设计,而是专为编程、工具使用、搜索、办公等真实工作流打造,采用MoE架构,具有推理速度快、延迟低、197K长上下文窗口等特点,完美匹配Agent长工作流需求[16][21] - 抓住市场时机:模型发布正值开源Agent框架OpenClaw爆发,公司官方迅速上线相关教程并被OpenClaw文档列为推荐模型,从而直接吃到了OpenClaw爆发的红利,OpenClaw是其月调用量最大的单一应用贡献者之一[24][25][26][27] - 开发者口碑:在Reddit和LocalLLaMA社区获得开发者好评,被认为在工具调用和多步工作流上表现优秀,且性价比高[23] MiniMax公司的竞争优势与商业潜力 - 先发与迭代优势:在行业押注Agent的共识下,公司因押对方向而具备先发优势;模型迭代速度快,从2025年12月的M2.1迭代至2026年2月的M2.5,速度快于Anthropic、OpenAI、Google等海外巨头,并持续向Agent密集场景打磨[29][30][32][33] - 用户粘性潜力:一旦开发者围绕M2.5构建了完整的工作流(包括prompt、工具调用、长上下文处理等),切换模型的迁移成本和账单重算成本很高,这有助于将调用量沉淀为“Agent默认选项”[30][31][37] - 已验证的商业化能力:公司已证明大模型未必只能在“收入增长”和“大幅亏损”间二选一,2025年收入同比增长158.9%至7904万美元,经调整净亏损同比仅增2.7%至2.509亿美元,毛利率从12.2%提升至25.4%,经营效率改善早于同行[41][42][44] - 多元化且国际化的收入结构:收入不依赖单一模型或App - AI-native products(如海螺AI、Talkie)2025年收入约5310万美元,占比约2/3[46] - Open Platform及其他企业服务(模型API、开放平台等)2025年收入约2596万美元,占比约1/3[47] - 70%以上收入来自国际市场,2025年增长很大程度上源于中国以外的销售[51] - 增长加速迹象:M2.5模型带动业务加速,2026年前两个月模型调用量与新增用户规模跃升,M2系列文本模型在2026年2月的平均单日Token消耗量较2025年12月增长6倍以上[49] - 资本市场认可:2026年3月10日收盘,公司市值首次超过百度[53] 主要竞争对手动态 - Step 3.5 Flash (阶跃星辰):以免费策略形成强大杀伤力,尤其吸引处于试验期的开发者和团队,调用量迅速抬升,周调用量达2.38T tokens,增长12424%[7][36] - Gemini 3 Flash Preview (Google):周调用量4.04T tokens,增长156%[7] - Kimi K2.5 (Moonshot AI):定位与M2.5类似,专注于复杂工作流、工具调用和长链路任务,争夺Agent/研究/编程用户,周调用量3.79T tokens,增长1119%[7][36] - DeepSeek V3.2:周调用量3.45T tokens,增长166%[7] - Claude Opus 4.6 (Anthropic):周调用量2.86T tokens,增长11331%[7]
霸榜全球大模型,MiniMax凭什么力压Claude、GPT?
阿尔法工场研究院·2026-03-12 19:34