Workflow
物理世界AGI
icon
搜索文档
小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线
量子位· 2025-12-18 08:30
模型发布与市场定位 - 小米公司新近官宣的开源大语言模型MiMo-V2-Flash,已成功跻身开源模型第一梯队[1][2] - 该模型以309B的总参数量实现了“以小博大”,在多项权威评测中取得优异成绩,展现出极高的效能密度[4][11] - 模型在实现高达2.6倍推理加速的同时,兼顾了顶尖的模型效果与极致的部署成本[6] - 模型在海外平台受到广泛好评,用户认为其能让智能体变得更加实用,并期待推出更多适配格式[9][10] 核心技术架构与创新 - 模型采用MoE架构,总参数量309B,包含256个专家,但通过动态激活机制,每次仅激活8个专家,对应参数量15B[11][12] - 采用5:1混合的滑动窗口注意力与全局注意力机制,以平衡效率与长文理解能力[13][14] - 引入“可学习的注意力汇聚偏置”技术,解决了滑动窗口注意力可能导致的语义断层问题,在将KV Cache显存占用降低到1/6的情况下,长文理解能力不降反升[15][16][17] - 其滑动窗口大小虽仅为128,但效果优于512的大窗口[19] - 采用多层Token预测技术,该模块在推理时被复用为投机解码的草稿模型,加载3层MTP模块后可实现2至2.6倍的实际推理加速比[20][21] - 训练流程采用多教师在线策略蒸馏新范式,使学生模型仅需消耗传统SFT+RL流程约1/50的精力就能迅速追平教师模型能力[23] 性能表现与基准测试 - 在衡量通用能力的Arena-Hard基准测试中得分86.2,在复杂推理任务MMLU-Pro中得分84.9[27] - 代码能力是其突出长板,在SWE-Bench Verified评测中斩获73.4%的高分,超越了DeepSeek-V3.2的73.1%和Kimi-K2 Thinking的71.3%[28] - 在Agent能力方面表现卓越,在SWE-Bench Multilingual测试中解决了71.7%的问题,在衡量工具使用能力的Tau2-Bench中得分达到80.3,均位列全球开源模型前茅[28] - 在官方“价格vs速度”坐标系中占据高能效生态位,其API定价极具竞争力,为每百万输入0.7元、输出2.1元[25] 实际应用场景演示 - 在具体工程化场景中展现出极高的编程完成度,例如能一次性生成完整的前端代码来构建一个网页版macOS操作系统,功能完备性优于闭源模型Gemini 3 Pro[30][31][36][38] - 不仅能够生成复杂交互网页,还能调用各种HTML接口,实现如基于摄像头的手势控制等高级功能[40][41][42] - 在人文交互与语义理解方面展现出清晰的逻辑与拟人化的温度,能够探讨开放性话题并提供情感建议[50][51][52][53][54] 公司战略与行业影响 - 小米的大模型发展轨迹清晰,从MiMo一代的7B模型积累经验,到MiMo二代直接达到世界先进水平,体现了其持续性的技术投入[56] - 公司的核心逻辑是死磕“高效+智能”,旨在让模型跑得快、用起来便宜且足够智能[57] - 按照规划,Flash纯语言模型只是“开路先锋”,后续将有多模态模型等更多产品登场[57] - 这标志着小米正加速从一家硬件大厂,向一家拥有独立底层核心的“大模型公司”转型[58] - 公司的战略是基于其独特的“人车家全生态”硬件布局,旨在为这个硬件帝国打造一个统一的“大脑”,使AI能精准指挥各类硬件,打通数字世界与物理世界[60][62][63] - 这种向“物理世界AGI”迈进的尝试,揭示了公司为下一代智能硬件交互提供动力、并实现更宏大野心的战略意图[65]
智平方完成新一轮A系列融资 深创投领投超亿元
证券时报网· 2025-09-01 17:23
融资情况 - 公司完成由深创投领投的新一轮A系列融资 深创投单家投资超1亿元 老股东敦鸿资产和国投创盈持续加码 华熙生物和某大型零售企业以产业资本身份参与[1] - 敦鸿资产曾连续投资宇树 并参与公司此前多轮融资[1] - 公司在半年内完成7轮亿元级融资 此前获得国中资本领投的Pre-A+++轮和普华资本领投的A+轮融资 引入达晨财智 基石资本 南山战新投等机构投资[1] 资金用途 - 本轮融资将用于GOVLA大模型及AlphaBot系列机器人的持续迭代 自建产线扩容与全球市场拓展[1] 公司背景 - 公司成立于2023年4月 是国内知名具身智能机器人企业 全球最早提出并系统性研发物理世界AGI的企业[1] - 公司端到端具身大模型AI2R Brain在开源精度 泛化任务成功率及端侧运行速度等方面领先[1] - 公司创始人兼CEO郭彦东曾任小鹏汽车和OPPO的首席科学家与研发高管[1] 产品与技术 - 公司已推出三代机器人产品Alpha Bot Alpha Bot 1S和AlphaBot 2 均为轮式可升降人形机器人[2] - 最新一代AlphaBot 2全身具备34个自由度 无需训练即可完成多种任务 可快速掌握新任务并适应各种变化 适配汽车制造 半导体制造 公共服务 生物科技等多样化任务[2] - 公司于今年4月发布全球首个全域全身VLA大模型(GOVLA) 也是全球首个输出快慢系统融合的端到端大模型[2] - GOVLA大模型首次提出输出全身控制和移动轨迹 实现全身协同控制和全场景任务覆盖中的高效交互与自主行动 而常规VLA大模型只能输出机械臂动作[2] 商业化进展 - 公司在工业 生物科技 公共服务等多领域落地并实现大规模部署[2] - 公司坚持"智能驱动 商业闭环"策略 打造具备复利效应的成长路径[2]