Workflow
雷军“千万年薪”挖角传闻落地!前DeepSeek“天才少女”官宣加盟小米
观察者网·2025-11-12 15:32

核心事件概述 - 前DeepSeek研究员罗福莉于2025年11月12日通过朋友圈正式确认加入小米,在MiMo团队工作[1] - 罗福莉的加盟为小米的AI战略,特别是“端侧AI”与“人车家全生态”提供了关键技术支持[1] - 罗福莉在声明中表示其工作目标是“智能终将从语言迈向物理世界”,致力于构建AGI未来[1] 罗福莉职业背景与技术专长 - 罗福莉拥有北京师范大学计算机专业学士学位和北京大学计算语言学研究所硕士学位[4] - 其在2019年读研二期间,在人工智能顶级会议ACL上一次性发表8篇论文,其中2篇为第一作者[4] - 研究生毕业后进入阿里达摩院,主导开发了多语言预训练模型VECO,该模型被纳入阿里深度语言模型体系AliceMind[5] - 2022年加入幻方量化旗下DeepSeek,参与研发以“性价比之王”著称的MoE架构大模型DeepSeek-V2,该模型中文水平处于国内外闭源模型第一梯队,价格仅为GPT-4的1/100[5] - 在DeepSeek期间展现出对开源社区的深刻理解,曾亲自撰写技术解读[5] - 值得注意的是,罗福莉并未参与今年年初让DeepSeek爆火的V3和R1模型的研发工作,并已离开DeepSeek[7] 加盟小米的传闻与前期合作 - 关于罗福莉加盟小米的传闻始于2024年12月,传闻称小米创始人雷军亲自以千万年薪级别力邀其领导大模型团队[8] - 2025年2月,有亲属表示罗福莉已到新岗位上班,但当时小米员工系统并无其信息,本人也未透露去向[8] - 2025年10月14日,小米与北京大学联合署名的论文发表于arXiv,罗福莉位列通讯作者,表明双方已进行深度合作[9] - 2025年9月,罗福莉在知乎点赞了小米语音大模型Xiaomi-MiMo-Audio的开源帖子[12] 小米的AI战略与技术路径 - 小米AI实验室成立于2016年初,研究方向涵盖视觉、声学、语音、自然语言处理等全栈技术领域[13] - 2023年4月,小米AI实验室下设专门的大模型团队[13] - 公司AI思路与当时主流观点不同,明确表示“不会做ChatGPT,不搞AI的军备竞赛”,认为轻量级模型存在市场空间并在特定任务上具有优势[13] - 2023年8月,雷军在年度演讲中提出小米的AI战略是轻量化+本地部署的思路,现场展示的MiLM-1.3B模型参数量远低于当时行业几十B起步的水平[14] - 2024年,雷军亲自推动小米GPU万卡集群建设,年中已拥有6500张GPU,并计划扩容至万卡规模[17] - 2025年2月,雷军宣布小米2025年研发费用将超300亿元,其中约75亿元(1/4)用于AI领域,重点投向GPU集群、大模型开发及场景落地[17] - 未来五年(2026-2030年),公司研发投入预计超2000亿元,聚焦AI、OS、芯片三大底层技术,作为“人车家”生态的技术底座[17] MiMo团队与技术成果 - 罗福莉加入的MiMo团队是小米的推理大模型团队,来自新成立的“小米大模型Core团队”[14] - 2025年4月,小米开源首个“为推理而生”的大模型Xiaomi MiMo,仅用70亿参数就在数学推理和代码竞赛测评中超越了OpenAI的闭源模型o1-mini和阿里320亿参数的开源模型QwQ-32B-Preview[14] - 这一成绩验证了小米“小参数大能量”的技术路径[14] 行业趋势与战略意义 - 顶尖AI研究员从DeepSeek等新锐公司流向小米等传统硬件巨头,暗示AI大模型竞争进入“应用深化期”[17] - 当基础模型能力逐渐收敛,如何将AGI理想转化为手机、汽车、智能家居中的真实体验成为新的赛点[17] - 罗福莉的复合经验将为小米汽车在端侧AI、多传感器融合、拟人化交互等方面提供关键技术支持[13]