报告行业投资评级 - 行业投资评级为“看好”,并予以“维持” [8] 报告核心观点 - MiniMax M2模型的发布为开源模型在执行智能和企业应用领域打开了新的想象空间 [2][10] - 当前时点大模型商业化变现有望加速,需关注模型降本效果 [2][10] - 继续看好国产AI产业链,持续重点推荐“铲子股”和卡位优势显著的巨头本身 [2][10] 事件描述 - 10月27日,稀宇科技正式开源并上线MiniMax M2模型 [2][5] - 模型采用MoE架构,总参数230B(激活参数10B),专为Agent和代码设计 [2][5] - M2的完整权重已依据MIT协议全面开源,全球范围限时免费开放 [2][5] - 同时,MiniMax Agent国内版上线、海外版升级 [2][5] 模型性能表现 - 代码能力:在SWE-bench Verified测试中得分69.4,仅次于GPT-5和Claude,是国产模型首次在真实编程任务上稳定进入第一梯队 [10] - Agentic表现:在Artificial Analysis测试中以61分获得总排名第五、开源第一 [10] - 工具使用:在τ²-Bench测试中获77.2分,位列国产模型第一,次于Claude Sonnet 4.5(84.7分)和GPT-5(80.1分) [10] - 深度搜索:在BrowseComp和xbench-DeepSearch测试中均为稳定的tier1级别发挥 [10] - 实用性:在FinSearchComp-global金融专业领域检索分析能力测试中以65.5分登顶全球第一 [10] 技术架构优势 - 采用全注意力机制,保证每一步推理都能看到完整的必要上下文,实现深链条信息完整可见 [10] - 采用交错的思维格式,使模型能够规划和验证跨多个对话的操作步骤,这对于Agent推理至关重要 [10] - 技术路线旨在将资源集中在代码生成、工具调用、浏览器/终端自动化等可执行型Agent任务上 [10] 成本与效率优势 - M2输入价格约为$0.3/MToken(约合人民币2.1元),输出价格约为$1.20/MToken(约合人民币8.4元),约为Claude 4.5 Sonnet价格的8% [10] - 线上提供TPS(每秒输出Token数)约100的推理服务,且还在快速提升 [10] 市场反响与商业化前景 - 截至11月6日,M2位居OpenRouter和HuggingFace趋势榜全球第一 [10] - M2是OpenRouter上第一个日token消耗量超过50B的中国模型 [10] - MiniMax Agent推出专业和高效模式,专业模式擅长全栈开发/deep research/PPT制作,高效模式在chat问答/轻量级搜索/轻量级代码场景极速输出 [10] - 市场反响热烈意味着市场更加关注AI模型“为什么能做、能否持续做”,M2为企业带来了更可靠的用户体验,更容易形成产品标准,加快商业化落地 [10] - MiniMax正加速构建面向Agent生态的产品体系 [2][10]
AI产业跟踪:MiniMax-M2发布,登顶开源模型,持续关注大模型商业化落地进展
长江证券·2025-11-09 22:32