金句媲美雷军,罗福莉首次站台小米演讲,揭秘MiMo大模型和背后团队
小米集团小米集团(HK:01810) 36氪·2025-12-17 12:17

公司战略与财务表现 - 小米集团2025年被定义为“大发展”之年,2024年前三季度收入同比增长32.5%至超过3400亿元,经调整利润同比增长73.5% [7] - 公司未来五年研发投入预计将超过2000亿元,其中2026年预计研发投入约400亿元 [7] - “AI与现实世界深度融合”被列为小米未来十年的核心战略,公司已准备All in AI [31] - 公司业务聚焦于“人车家全生态”,涵盖个人设备、出行设备、家庭设备三大产品线,核心技术为芯片、OS、AI,并拥有手机、汽车、大家电的智能制造能力 [10] 人工智能与大模型战略 - 小米自研MiMo系列大模型家族,包括推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型 [12] - 公司打造Agent语言基座模型的三个核心方向是:超强的代码和工具调用能力作为高效“语言”、围绕极致推理效率设计的模型结构作为“高带宽”协作关键、全新后训练范式以保证高效稳定的扩展强化学习训练 [16][18] - 小米认为下一代智能体系统不是“语言模拟器”,而是能理解世界并与之共存的“智能体”,强调AI需与物理世界交互 [5][27] - 公司认为算力和数据并非最终护城河,真正的护城河是科学的研究文化与方法,以及将未知问题结合模型优化转化为可用产品的能力 [5][28] 技术进展与产品发布 - 小米最新发布的MiMo-V2-Flash模型性能媲美DeepSeek-V3.2,是其核心成员罗福莉加入后团队亮出的首个成果 [14] - MiMo-V2-Flash模型在代码和Agent测评基准测试中达到全球开源模型TOP2水平,其突出优势是推理效率,实现了低成本和高速度 [17][20] - 该模型采用Hybrid SWA架构、固定KV Cache以增强长文推理,并通过3层MTP推理加速并行Token验证,实现推理速度2-2.6倍的提升 [20] - MiMo-V2-Flash已初步具备模拟世界的能力,例如通过HTML写操作系统、模拟太阳系 [22] - 该模型发布即开源,模型权重、技术报告均开源,API限时免费 [25] 行业观点与研发理念 - AI正以非线性方式重演人类大脑6亿年的进化史,语言被视为人类思维和物理世界在符号空间的“投影” [5][15] - 行业对AGI路径存在不同观点,有观点认为语言即可实现最终AGI,但小米团队认为AI进化的下一个起点必须是能与物理世界交互的模型 [27][28] - 开源被视为实现AGI普惠化和确保全人类智慧共同进化的唯一路径,其价值被定义为一种分布式的技术加速主义 [5][30] - 顶尖开源模型与顶尖闭源模型的性能差距已从三年前缩短至“数月” [30] - 小米大模型Core团队定位为研究、产品与工程深度耦合的“小而美”团队,强调创业精神和追求真理 [28]