中国独角兽开源M2比肩硅谷技术,成本仅8%
环球网资讯·2025-10-28 14:39

模型发布与核心性能 - 中国AI公司MiniMax于2025年10月27日正式发布并开源新一代文本大模型MiniMax-M2 [1] - 该模型采用混合专家架构,总参数为2300亿,激活参数为100亿,是一款轻量级模型 [1][13] - 在行业测评榜单Artificial Analysis上,M2模型总分冲入全球前五,在开源模型中排名第一,超越了谷歌的Gemini 2.5 Pro和Anthropic的Claude 4.1等模型 [1][15] 技术能力与基准测试表现 - 模型专为编码和智能体任务深度优化,具备强大的端到端开发能力,能够处理多代码文件并执行完整的“编码-运行-调试”循环 [20][21] - 在Xbench-DeepSearch基准测试中,M2的深度搜索能力位列全球前二,仅次于GPT-5 [21] - 在字节推出的金融搜索基准FinSearchComp-global上,M2同样位列全球前二,仅次于Grok-4 [21] - 在Reddit社区分享的基准测试中,M2获得了58.3%的分数 [8][19] 成本效率与市场反响 - M2的API服务定价为每百万Token输入0.3美元,输出1.2美元,综合成本不到Claude 4.5 Sonnet的8% [1][6][22] - 在OpenRouter平台上线不到两天,模型调用量已跻身全球前10 [22] - 海外开发者如CoreViewHQ联合创始人兼CTO Ivan Fioravant测试后评价模型表现出色,甚至优于Claude 4.1 Opus [8][10] 行业影响与算法创新 - M2的发布被视为中国AI实验室在开源领域领先地位的延续,继DeepSeek、阿里巴巴、Z AI和Moonshot AI之后 [1][6] - Meta在其最新的强化学习论文《The Art of Scaling Reinforcement Learning Compute for LLMs》中,大规模验证并采用了MiniMax原创的CISPO损失函数和FP32 Head技术 [26] - 论文指出MiniMax的CISPO算法在效率上显著高于现有的DAPO算法,并将MiniMax列为推动大规模强化学习ScaleRL突破的关键 [26]