小米MiMo
搜索文档
全网都在扒的小米MiMo团队,几乎被“北大学子”承包了
量子位· 2026-03-20 08:18
小米MiMo团队的管理与绩效 - 团队负责人罗福莉对团队管理提出思考,暗示对Agent对话次数有高要求,每天少于100次可能面临离职[1][2] - 团队的管理风格和绩效要求引发外界广泛关注[3] 小米MiMo模型的市场表现与行业地位 - 小米MiMo-V2-Pro模型在OpenRouter调用量榜单上排名第一[1] - 从发布首个推理大模型MiMo-7B至今不到一年,模型能力曲线陡升,已进入全球一线梯队[5] - 与Meta超级智能实验室近期模型跳票、性能不及预期的表现形成对比[7] 小米MiMo团队的核心成员构成 - 团队核心成员共21人,包括Bingquan Xia、Bowen Shen、Cici、Dawei Zhu、Di Zhang、Gang Wang、Hailin Zhang、Huaqiu Liu、Jiebao Xiao、Jinhao Dong、Liang Zhao、Peidian Li、Peng Wang、Shihua Yu、Shimao Chen、Weikun Wang、Wenhan Ma、Xiangwei Deng、Yi Huang、Yifan Song、Zihan Jiang[14] - 肖邦骏(Bangjun Xiao)是MiMo-V2-Flash的首作,本博均就读于北京大学,导师为北京大学人工智能研究院副院长黄罡教授,研究方向为边缘计算和联邦学习[16][18][19] - Bingquan Xia是MiMo-V2-Flash核心作者之一,中科院计算技术研究所2021届研究生,有相关论文发表[20][21] - 马文晗(Wenhan Ma)自2025年9月起在北京大学计算机科学学院攻读博士,导师为穗志方教授,研究方向为大语言模型推理能力,本科毕业于北京大学,是罗福莉的同门师弟[23][24][25] - 朱大为(Dawei Zhu)是北京大学三年级博士生,导师为李素建教授,研究方向为长上下文建模,对智能体、对齐及多模态模型感兴趣[26][28] - 董谨豪是中国人民大学信息学院讲师,小米LLM核心团队技术顾问,负责代码相关LLM开发,主导建立了人大-小米基础大语言模型联合重点实验室[32][34] - 张海林专注于AI基础设施建设,为MiMo系列打造强化学习基础设施,2025年获北京大学计算机科学博士学位[36][37] 小米MiMo团队的背景与成功因素 - 团队具有浓厚的北京大学背景,核心成员与技术骨干多来自北京大学计算机学院,这为团队提供了持续的人才输送和科研想法快速落地的渠道[41][42][43] - 罗福莉是团队与北大学术背景之间的重要桥梁[44] - 团队技术理念受小米公司产品基因驱动,强调“性价比”和“互联网生态”思维[46] - 在MiMo模型上体现为7B参数规模、开源策略及端侧部署方向,反映了公司的战略布局和生态思路[47] - 团队成功是北大科研背景、核心成员技术经验以及小米产品与工程基因共同作用的结果[48] 行业关联与人物关系 - 前阿里通义实验室Qwen大模型负责人林俊旸是罗福莉的师兄,两人硕士阶段均在北京大学从事自然语言处理研究,学术路径同源,先后加入阿里达摩院[49][50][51] - 林俊旸曾负责Qwen模型,罗福莉带领MiMo模型,两人是国内头部模型线的关键人物,成长于同一套学术和产业体系[52][53]
DeepSeek前骨干罗福莉C位亮相小米,曾网传雷军千万年薪挖她
程序员的那些事· 2025-11-13 19:24
罗福莉加入小米事件 - 罗福莉于11月12日首次官方宣布加入小米,担任MiMo团队负责人[1][3] - 罗福莉在X平台上高调宣布正式加入小米,出任MiMo团队负责人[3] - 此次任命标志着此前约一年的传闻最终落地[5] 小米的AI战略方向 - 小米在汽车业务步入正轨后,宣布将全力进军AI的深水区[9] - 小米AI的目标是推动智能从语言世界走向物理世界,解锁多模态的空间智能[4] - 空间智能被定义为具备感知、推理、生成与行动的能力,是实现通用人工智能(AGI)的关键一步[4][24] - 小米MiMo团队致力于推动空间智能发展,这与公司拥有的“人、车、家全生态”场景天然适配[24][26] 事件时间线与背景 - 2023年12月25日,DeepSeek-V3版本上线并宣布全面开源[6] - 2023年12月26日,媒体曝出小米正在组建GPU万卡集群[7] - 2023年12月31日,雷军在跨年直播中公开披露小米在AI方面的野心[8] - 坊间传闻雷军以千万年薪挖角DeepSeek核心开发者罗福莉[10] - 上个月,小米AI团队论文作者栏已出现罗福莉名字,但标注为“独立研究者”[11] 罗福莉的专业背景 - 罗福莉本科毕业于北京师范大学计算机专业,硕士就读于北京大学计算语言学[15] - 曾任职阿里巴巴达摩院机器智能实验室研究员,负责开发多语言预训练模型VECO并推动AliceMind项目开源[17] - 2022年加入DeepSeek母公司幻方量化,后担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型[17] - 学术论文总引用次数超过1.1万次,仅2024年就新增约八千次引用[18] - 在DeepSeek最新的Nature封面论文中,罗福莉名列作者之一[20] MiMo团队与空间智能 - 小米MiMo是公司推进大模型研发的核心招牌[24] - 空间智能概念旨在打通信息AI和物理AI,实现比特世界和原子世界的智能贯通[26] - AI教母李飞飞于11月10日发表万字长文,首次系统阐释“空间智能”概念及其对具身智能和AGI的意义[25] - 罗福莉作为独立研究员时,已在小米MiMo论文成果中起到承接作用,连接小米和北大团队[23]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
36氪· 2025-11-13 18:26
公司核心人事任命 - 罗福莉于11月12日正式官宣加入小米,出任MiMo团队负责人[1] - 罗福莉此前为DeepSeek核心开发者,坊间传闻小米以千万年薪将其挖角[4][7] - 罗福莉学术背景深厚,论文总引用次数超过1.1万次,今年新增约八千次引用[13][17] 公司AI战略方向 - 小米MiMo团队明确剑指空间智能,旨在实现从语言世界到物理世界的智能进化[3][23] - 空间智能被定义为具备感知、推理、生成与行动的能力,是实现通用人工智能的关键一步[4][23] - 雷军在跨年直播中披露,汽车业务步入正轨后,公司将全力进军AI深水区[7] - 小米AI战略与公司人、车、家全生态场景天然适配[25] 公司技术布局时间线 - 2023年12月25日DeepSeek-V3上线并开源,次日媒体曝出小米正在组建GPU万卡集群[5][6] - 2023年底传闻雷军挖角罗福莉,上月小米AI论文作者栏已出现罗福莉以独立研究员身份署名[7][8] - 罗福莉在小米最新MiMo论文中起到承接作用,连接小米与北大团队,通讯作者为其北大恩师[21]
中国电子:国产开源模型千帆竞发,阿里 Qwen-3、小米 MiMo、DeepSeek Prover 集中发布
海通国际证券· 2025-04-30 23:15
报告行业投资评级 未提及 报告的核心观点 - 阿里 Qwen 当前位列开源大模型排行榜首,凭借领先性能及完善开源策略,未来有望在能力与生态变现方面持续领先,且部署成本显著降低 [2] - 随着国产模型开源增多,未来应用和商业化会面临同质化竞争问题,开源模型将向定制化演进,成熟 Agent 会改写行业格局,是 AI 商业化下个突破口 [5] 根据相关目录分别进行总结 事件 - 2025 年 4 月 28 日,阿里发布新一代 Qwen - 3 系列大语言模型,含多个量级版本 [1] - 2025 年 4 月 30 日,小米发布并开源首个专为推理任务设计的大语言模型 Xiaomi MiMo;DeepSeek 团队在 Hugging Face 平台发布最新大语言模型 DeepSeek - Prover - V2 - 671B [1] 阿里 Qwen - 3 - 具备多尺寸覆盖能力,推出多个参数规模模型,能满足不同场景推理需求 [1] - 性能显著提升,在多项公开评测基准上,相较前代模型准确率提升 10–30% [1] - 引入先进稀疏注意力机制和推理加速技术,相同硬件资源下推理速度提高 20%–40%,增强实用性和部署效率 [1] 小米 Xiaomi MiMo - 70 亿参数规模,在数学推理和代码生成等任务中性能卓越,超越部分更大规模模型 [3] - 采用三阶段逐步提升难度训练方法,总计训练 25T tokens 增强推理能力 [3] - 后训练阶段引入“测试难度驱动奖励”机制,结合“简单数据重采样”策略和“无缝推出系统”,提升强化学习稳定性和训练效率,使强化学习训练速度提升 2.29 倍、验证过程加快 1.96 倍 [3] DeepSeek - Prover - V2 - 671B - 在数学定理证明任务中表现出色,特别是形式化数学证明领域 [4] - 发布展示了 DeepSeek 在大模型领域技术实力,预示其在形式化推理和专业领域应用的战略布局 [4] - 上线可能为即将发布的 DeepSeek - R2 模型做能力验证或预热,显示推动 AI 技术向更深层次发展的决心 [4]