MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
数字生命卡兹克·2025-06-17 08:23
MiniMax M1模型发布 - 公司发布首个开源推理模型MiniMax M1,采用456B参数MoE架构,实际激活45.9B参数,支持100万字(1M)上下文长度[10] - 模型在MRCR(4-needle)测试中表现突出,准确率62.8%,与Gemini 2.5 Pro性能接近[3][6][8] - 采用Lightning Attention线性注意力机制,64K token生成时FLOPs消耗仅为DeepSeek R1的一半,100K token时仅消耗25%[9][10] 技术性能亮点 - 开源两个版本:40K和80K Extended Thinking上限版本,80K版本为40K的增强版[12] - 在TAU-bench(任务目标理解测试)表现达到开源模型领先水平[3] - 支持复杂文档处理,可准确提取并翻译技术报告中的图表、公式和表格内容[15][17][20] 应用场景展示 - 成功处理34篇刘慈欣小说合集,完成每篇的故事总结和推荐语[34][37] - 在文字冒险游戏场景中展现出优秀的上下文记忆能力[31] - 能够准确识别并提取微信群聊中特定用户的全部聊天记录[28] 行业影响 - 该模型将开源领域的上下文处理能力提升到新高度[8] - 公司预告将持续一周发布新产品,可能涉及视频、音乐等领域[42][44][46] - 此次发布标志着AI六小虎之一的MiniMax重新活跃于行业前沿[1]