53万美金训练出顶级AI?揭秘MiniMax的「省钱」绝招
36氪·2025-06-20 08:11
这几天,MiniMax 搞起了技术周,第一天就放出"王炸",开源了全球首个大规模混合架构推理模型 MiniMax-M1。据最新消息,M1 已经成为全球前二的 开源模型。 MiniMax 分别用最大生成长度的 40K 和 80K token,训练了两个版本的 MiniMax-M1 模型——MiniMax-M1-40k 和 MiniMax-M1-80k。MiniMax-M1-80k 在 复杂的数学和编码任务上优于 MiniMax-M1-40k。 据观察,MiniMax-M1 在全球科技领域引起了强烈的反响。产品不仅迅速占据海外主流媒体如 VentureBeat、Seekingalpha 等重要版面,更获得 Aran Komatsuzaki 等行业 KOL 的深度解读,同时在 TestTM 等国际社交平台引发讨论,形成多维度、跨圈层的传播矩阵。 (全球科技领域大V评论截图) 全球最长上下文,MiniMax-M1 是如何做到的? MiniMax-M1 基于之前的 MiniMax-Text-01 模型开发,总共包含 4560 亿个参数,459 亿个激活函数,并具备 32 层架构,其最大的亮点是支持目前业内最 高的 10 ...