物理世界AGI - 财报，业绩电话会，研报，新闻

物理世界AGI

搜索文档

量子位· 2025-12-18 08:30

模型发布与市场定位 - 小米公司新近官宣的开源大语言模型MiMo-V2-Flash，已成功跻身开源模型第一梯队[1][2] - 该模型以309B的总参数量实现了“以小博大”，在多项权威评测中取得优异成绩，展现出极高的效能密度[4][11] - 模型在实现高达2.6倍推理加速的同时，兼顾了顶尖的模型效果与极致的部署成本[6] - 模型在海外平台受到广泛好评，用户认为其能让智能体变得更加实用，并期待推出更多适配格式[9][10] 核心技术架构与创新 - 模型采用MoE架构，总参数量309B，包含256个专家，但通过动态激活机制，每次仅激活8个专家，对应参数量15B[11][12] - 采用5:1混合的滑动窗口注意力与全局注意力机制，以平衡效率与长文理解能力[13][14] - 引入“可学习的注意力汇聚偏置”技术，解决了滑动窗口注意力可能导致的语义断层问题，在将KV Cache显存占用降低到1/6的情况下，长文理解能力不降反升[15][16][17] - 其滑动窗口大小虽仅为128，但效果优于512的大窗口[19] - 采用多层Token预测技术，该模块在推理时被复用为投机解码的草稿模型，加载3层MTP模块后可实现2至2.6倍的实际推理加速比[20][21] - 训练流程采用多教师在线策略蒸馏新范式，使学生模型仅需消耗传统SFT+RL流程约1/50的精力就能迅速追平教师模型能力[23] 性能表现与基准测试 - 在衡量通用能力的Arena-Hard基准测试中得分86.2，在复杂推理任务MMLU-Pro中得分84.9[27] - 代码能力是其突出长板，在SWE-Bench Verified评测中斩获73.4%的高分，超越了DeepSeek-V3.2的73.1%和Kimi-K2 Thinking的71.3%[28] - 在Agent能力方面表现卓越，在SWE-Bench Multilingual测试中解决了71.7%的问题，在衡量工具使用能力的Tau2-Bench中得分达到80.3，均位列全球开源模型前茅[28] - 在官方“价格vs速度”坐标系中占据高能效生态位，其API定价极具竞争力，为每百万输入0.7元、输出2.1元[25] 实际应用场景演示 - 在具体工程化场景中展现出极高的编程完成度，例如能一次性生成完整的前端代码来构建一个网页版macOS操作系统，功能完备性优于闭源模型Gemini 3 Pro[30][31][36][38] - 不仅能够生成复杂交互网页，还能调用各种HTML接口，实现如基于摄像头的手势控制等高级功能[40][41][42] - 在人文交互与语义理解方面展现出清晰的逻辑与拟人化的温度，能够探讨开放性话题并提供情感建议[50][51][52][53][54] 公司战略与行业影响 - 小米的大模型发展轨迹清晰，从MiMo一代的7B模型积累经验，到MiMo二代直接达到世界先进水平，体现了其持续性的技术投入[56] - 公司的核心逻辑是死磕“高效+智能”，旨在让模型跑得快、用起来便宜且足够智能[57] - 按照规划，Flash纯语言模型只是“开路先锋”，后续将有多模态模型等更多产品登场[57] - 这标志着小米正加速从一家硬件大厂，向一家拥有独立底层核心的“大模型公司”转型[58] - 公司的战略是基于其独特的“人车家全生态”硬件布局，旨在为这个硬件帝国打造一个统一的“大脑”，使AI能精准指挥各类硬件，打通数字世界与物理世界[60][62][63] - 这种向“物理世界AGI”迈进的尝试，揭示了公司为下一代智能硬件交互提供动力、并实现更宏大野心的战略意图[65]