小米大模型战略转向与产品发布 - 公司于4月30日正式宣布开源其首个推理大模型Xiaomi MiMo,并首次公开了小米大模型Core团队[1][3] - 公司此前曾公开表示不会做OpenAI类的大模型,但时隔两年后态度发生转变,选择在2025年进入大模型领域[7][8] - 公司认为尽管当前看似是大模型发展的后半程,但坚信AGI(通用人工智能)的征途仍然漫长[1][8] 模型性能与技术细节 - 开源模型为Xiaomi MiMo-7B-RL,是一个7B参数规模的模型,强调可在端侧设备本地运行,主打经济高效[3][6] - 该模型在强化学习训练后,于数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,得分超越了OpenAI的闭源模型o1-mini和阿里Qwen的32B参数开源模型QwQ-32B-Preview[1][3] - 模型能力提升由预训练和后训练联合驱动:预训练阶段合成了约2000亿tokens的推理数据;总训练量达25万亿tokens;后训练阶段通过新算法和框架,使强化学习训练加速2.29倍,验证加速1.96倍[6] 团队建设与人才招聘 - 公司正在为新成立不久的大模型Core团队“招兵买马”,在招聘平台发布了大量相关岗位[2][8] - 招聘岗位包括大模型算法专家、推理工程师、数据策略工程师、高性能优化工程师、多模态算法工程师等,部分标注为“急招”[8] - 为吸引人才,公司为部分大模型相关岗位开出了最高达128万元的年薪[2][10] 应用场景与业务结合 - 从招聘详情可见,公司做大模型主要倾向于两个方向:一是模型小型化便于在端侧落地;二是应用场景与自身现有业务及产品线深度结合[10] - 具体的落地应用场景包括:智能门锁、智能音箱、智能招聘、AI面试、AI会议助理、AI办公助手、智能客服、智能审核等[2][8] - 多模态大模型算法工程师等岗位的职责也明确涉及文生图、图生图算法,以及大模型在生态链产品中的研发和落地[8][9]
小米开源首个推理大模型 曾说不做OpenAI类大模型,现开出百万元年薪给团队“招兵买马”