小米首个推理大模型突然开源！小米也加入AI战局！

小米AI大模型技术突破 - 公司推出开源大模型MiMo 仅用7B参数规模在数学推理和代码竞赛测评中超越OpenAI闭源模型o1-mini及阿里32B规模模型QwQ [3][4] - 在相同强化学习训练数据条件下 MiMo-7B在数学和代码领域强化学习潜力领先DeepSeek-R1-Distill-7B和Qwen2.5-32B等知名模型 [6] 技术创新与实现路径 - 预训练阶段挖掘富含推理模式语料合成约200B tokens推理数据采用三阶段训练策略累计训练25T tokens [8] - 后训练阶段提出Test Difficulty Driven Reward机制解决困难算法奖励稀疏问题引入Easy Data Re-Sampling策略提升训练稳定性 [9] - 设计Seamless Rollout系统使强化学习训练速度提升2.29倍验证速度提升1.96倍 [9] 战略投入与人才布局 - 公司正在建设万卡GPU集群创始人亲自领导AI大模型投入计划 [11] - 引入顶尖AI人才包括DeepSeek-V2关键开发者罗福莉加入其MLA技术可降低大模型使用成本 [11]