小米MiMo大模型

搜索文档
卢伟冰:AI和芯片是小米两大关键战略
中国经营报· 2025-05-29 11:39
核心观点 - 公司宣布2025年第一季度业绩为史上最强单季度财报,并重申2026-2030年将投入2000亿元研发费用,聚焦硬科技领域,尤其是AI和芯片两大子战略 [2] - 公司提出未来十年发展目标,致力于成为全球硬核科技引领者,2021-2025年研发投入预计超1020亿元,2025年单年研发投入预估达300亿元 [2][3] - 公司计划从高端向超高端市场突破,强化手机、汽车等全品类高端化,并推动全球化战略 [3][4] 财务与研发投入 - 公司2026-2030年研发投入目标为2000亿元,旨在构建技术护城河 [2][3] - 2021-2025年研发投入预计超1020亿元,2025年单年研发投入预估达300亿元 [2] - 芯片部门自2021年重启大芯片项目以来,累计研发投入超135亿元,团队规模超2500人,位列中国境内前三 [6] 业务战略 - 智能手机业务在中低端市场占据优势,但高端市场仍面临品牌形象、用户忠诚度和技术溢价能力不足的挑战,短期内难以撼动苹果和三星的地位 [2] - 智能汽车业务处于成长初期,SU7交付量亮眼,但面临毛利率偏低、研发投入高、供应链复杂等问题,盈利模式尚未清晰 [2] - 公司计划从高端向超高端市场突破,手机目标价格段为6000元以上,汽车业务同步推进高端化 [3] 技术布局 - AI领域:公司发布开源大模型Xiaomi MiMo,7B参数规模在数学推理和代码竞赛测评中表现优异 [5] - 芯片领域:发布首款3nm旗舰手机SoC芯片玄戒O1(190亿晶体管)和首款自研4G基带芯片玄戒T1,技术处于全球第一梯队水平 [5] - 公司将持续投入芯片研发,未来十年至少投资500亿元,芯片部门为突破硬核科技的核心赛道 [6] 全球化与生态战略 - 公司计划将中国市场的经验和方法推向全球,巩固东南亚、拉美等新兴市场,拓展欧洲、中东等成熟市场 [3][4] - 深化"人车家全生态"融合,通过手机、家电、汽车、穿戴设备等终端的互联互通,构建统一生态系统平台 [4]
两位大模型从业者群友如何评价小米MiMo大模型?
理想TOP2· 2025-04-30 21:04
大模型性能对比 - Llama-3 8B在BBH基准测试中得分为64 2 显著低于Gemma-2 9B的69 4和Qwen2 5 7B的70 4 而MiMo-7B以75 2领先[1] - 在GPQA-Diamond测试中 Qwen2 5以35 4的准确率表现最佳 超过MiMo-7B的25 8[1] - MiMo-7B在SuperGPQA测试中获得25 1分 略优于Qwen2 5的24 6[1] - 数学能力方面 MiMo-7B在AIME 2024测试中取得32 9的高分 远超Qwen2 5的10 1[1] - 代码能力上 MiMo-7B在LiveCodeBench v5测试中获得32 9分 显著高于Qwen2 5的5 0[1] 中文能力表现 - Qwen2 5在C-Eval中文测试中获得81 8的高分 明显优于MiMo-7B的68 7[1] - CMMLU中文测试中 Qwen2 5以82 7分领先 MiMo-7B得分为70 9[1] - 预训练结果显示Qwen在中文问答方面具有明显优势 而MiMo-7B表现相对较弱[1] 模型训练策略 - MiMo-7B通过预训练偏重数学和代码能力 导致其他能力下降[1] - 强化学习主要提升数学和代码能力 但提升幅度不大 未见显著创新[1] - 7B模型在AIME测试中获得20多分是通过牺牲其他能力实现的技巧性高分 而非结构创新[1] - 小尺寸模型可能采用蒸馏技术训练 效果优于直接训练[4] - MiMo-7B使用"先进推理模型"合成数据进行训练[4] 行业讨论 - 参数规模差异大的模型不适合直接比较 如MindGPT是千亿参数级别[3] - 小参数模型训练更快 可专注特定指标展示实力[3] - 当前行业普遍采用合成数据策略 MindGPT也使用类似方法[7] - 理想汽车计划在2025年5月举办AI Talk第二季活动[9]