模型技术突破 - 公司发布全球首个开源大规模混合架构推理模型MiniMax-M1,具备百万Token级长文本处理能力,上下文窗口达100万Token,与谷歌Gemini 2.5 Pro持平,是DeepSeek-R1的8倍 [1][4] - 模型采用独创"Lightning Attention"混合架构,显著优化长文本计算效率,传统Transformer模型计算量随序列长度呈平方级增长的问题得到解决 [6] - 强化训练成本下降一个量级至53万美元,推理效率数倍于竞争对手 [1] 定价策略 - 采用分档定价策略:0-3.2万Token档输入0.8元/百万Token、输出8元/百万Token;3.2万-12.8万Token档输入1.2元/百万Token、输出16元/百万Token;12.8万-100万Token档输入2.4元/百万Token、输出24元/百万Token [4] - 前两档定价低于DeepSeek-R1,第三档为独家覆盖领域,自有平台App和Web端保持不限量免费使用 [4] 算法创新 - 提出CISPO算法(Clipped IS-weight Policy Optimization),通过裁剪重要性采样权重优化强化学习效率和稳定性,替代传统PPO/GRPO裁剪方式 [6] - 该算法未采用调整Token更新方式,而是另辟蹊径提升训练和推理成本效益 [6] 行业竞争格局 - 行业呈现技术快速迭代态势:阿里开源Qwen3参数量仅为DeepSeek-R1的1/3,百度文心大模型4.5 API价格仅为GPT-4.5的1% [7] - 专家认为基础模型仍有较大优化空间,算法突破方向将决定下一代科技巨头归属 [10] 公司战略方向 - 明确"加速技术迭代"为现阶段核心目标,结束半年战略摇摆期,将增长和收入目标置于技术突破之后 [8] - 2023年完成品牌整合(海螺AI更名MiniMax),2024年连续发布文本/视觉/语音多模态模型(01系列/VL-01/Speech-02) [8][9] - 布局AI Agent赛道,认为2025年将是关键发展节点,开源策略旨在促进长上下文研究和应用创新 [9] 商业化布局 - 采取B端+C端双线布局,覆盖国内外市场,在保持技术攻坚的同时推进商业化 [9] - 计划开展"开源周"活动,连续4个工作日发布新技术或产品更新 [10]
憋大招,MiniMax发布全球首个混合架构开源模型M1 能后来者居上吗?
每日经济新闻·2025-06-17 23:01