小米开源首个推理大模型曾说不做OpenAI类大模型，现开出百万元年薪给团队“招兵买马”

小米大模型战略转向与产品发布 - 公司于4月30日正式宣布开源其首个推理大模型Xiaomi MiMo，并首次公开了小米大模型Core团队[1][3] - 公司此前曾公开表示不会做OpenAI类的大模型，但时隔两年后态度发生转变，选择在2025年进入大模型领域[7][8] - 公司认为尽管当前看似是大模型发展的后半程，但坚信AGI（通用人工智能）的征途仍然漫长[1][8] 模型性能与技术细节 - 开源模型为Xiaomi MiMo-7B-RL，是一个7B参数规模的模型，强调可在端侧设备本地运行，主打经济高效[3][6] - 该模型在强化学习训练后，于数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，得分超越了OpenAI的闭源模型o1-mini和阿里Qwen的32B参数开源模型QwQ-32B-Preview[1][3] - 模型能力提升由预训练和后训练联合驱动：预训练阶段合成了约2000亿tokens的推理数据；总训练量达25万亿tokens；后训练阶段通过新算法和框架，使强化学习训练加速2.29倍，验证加速1.96倍[6] 团队建设与人才招聘 - 公司正在为新成立不久的大模型Core团队“招兵买马”，在招聘平台发布了大量相关岗位[2][8] - 招聘岗位包括大模型算法专家、推理工程师、数据策略工程师、高性能优化工程师、多模态算法工程师等，部分标注为“急招”[8] - 为吸引人才，公司为部分大模型相关岗位开出了最高达128万元的年薪[2][10] 应用场景与业务结合 - 从招聘详情可见，公司做大模型主要倾向于两个方向：一是模型小型化便于在端侧落地；二是应用场景与自身现有业务及产品线深度结合[10] - 具体的落地应用场景包括：智能门锁、智能音箱、智能招聘、AI面试、AI会议助理、AI办公助手、智能客服、智能审核等[2][8] - 多模态大模型算法工程师等岗位的职责也明确涉及文生图、图生图算法，以及大模型在生态链产品中的研发和落地[8][9]