憋大招，MiniMax发布全球首个混合架构开源模型M1 能后来者居上吗？

模型技术突破 - 公司发布全球首个开源大规模混合架构推理模型MiniMax-M1，具备百万Token级长文本处理能力，上下文窗口达100万Token，与谷歌Gemini 2.5 Pro持平，是DeepSeek-R1的8倍 [1][4] - 模型采用独创"Lightning Attention"混合架构，显著优化长文本计算效率，传统Transformer模型计算量随序列长度呈平方级增长的问题得到解决 [6] - 强化训练成本下降一个量级至53万美元，推理效率数倍于竞争对手 [1] 定价策略 - 采用分档定价策略：0-3.2万Token档输入0.8元/百万Token、输出8元/百万Token；3.2万-12.8万Token档输入1.2元/百万Token、输出16元/百万Token；12.8万-100万Token档输入2.4元/百万Token、输出24元/百万Token [4] - 前两档定价低于DeepSeek-R1，第三档为独家覆盖领域，自有平台App和Web端保持不限量免费使用 [4] 算法创新 - 提出CISPO算法（Clipped IS-weight Policy Optimization），通过裁剪重要性采样权重优化强化学习效率和稳定性，替代传统PPO/GRPO裁剪方式 [6] - 该算法未采用调整Token更新方式，而是另辟蹊径提升训练和推理成本效益 [6] 行业竞争格局 - 行业呈现技术快速迭代态势：阿里开源Qwen3参数量仅为DeepSeek-R1的1/3，百度文心大模型4.5 API价格仅为GPT-4.5的1% [7] - 专家认为基础模型仍有较大优化空间，算法突破方向将决定下一代科技巨头归属 [10] 公司战略方向 - 明确"加速技术迭代"为现阶段核心目标，结束半年战略摇摆期，将增长和收入目标置于技术突破之后 [8] - 2023年完成品牌整合（海螺AI更名MiniMax），2024年连续发布文本/视觉/语音多模态模型（01系列/VL-01/Speech-02） [8][9] - 布局AI Agent赛道，认为2025年将是关键发展节点，开源策略旨在促进长上下文研究和应用创新 [9] 商业化布局 - 采取B端+C端双线布局，覆盖国内外市场，在保持技术攻坚的同时推进商业化 [9] - 计划开展"开源周"活动，连续4个工作日发布新技术或产品更新 [10]