95后AI“天才少女”罗福莉走到台前,雷军能松口气了

小米AI大模型技术发布 - 小米开源了其最新的AI大模型Xiaomi MiMo-V2-Flash,该模型总参数量为309B,活跃参数量为15B,专为智能体AI设计[4][5] - 该模型在研发时聚焦三个核心问题:智能体需具备高效的代码与工具调用能力、需高推理效率的模型结构、需激发后训练阶段的潜能[7][8][9] - 尽管参数量较小,但该模型在代码能力和智能体能力上已达到全球开源模型的TOP2水平,性能超越了参数量为其2到3倍的DeepSeek-V3.2和Kimi K2-Thinking等模型[10] 模型性能与成本优势 - MiMo-V2-Flash的API定价为输入0.7元/百万tokens,输出2.1元/百万tokens,实现了低成本与高速度的组合[11] - 与竞品相比,该模型比DeepSeek-V3.2更便宜,且推理速度约为后者的三倍;与闭源模型Claude 4.5 Sonnet相比,推理价格仅为后者的2.5%,且生成速度提升至2倍[2][12] - 其效率提升源于模型结构创新,包括采用5:1的滑动窗口注意力与全局注意力混合结构,以及在推理阶段通过3层MTP并行验证实现2.0到2.6倍的推理加速[12] 团队背景与行业观点 - 小米大模型Core团队被描述为研究、产品与工程深度耦合的年轻团队,小而美且充满创新精神[2] - 团队负责人罗福莉认为,AI正以非线性方式重演人类大脑6亿年的进化史,但路径与生物进化相反:大模型先掌握语言,再补齐思考能力,最后获得对物理世界的感知[2][15] - 她指出,开源是一种“分布式的技术加速主义”,是实现AGI普惠化、确保全人类智慧共同进化的唯一路径,并提到国内开源模型与全球顶尖闭源模型的差距已从3年缩短至4个月[3] 下一代智能体发展愿景 - 当前大模型的缺陷在于其智能源于对海量文本的有损压缩,缺乏对物理世界的真实感知,这导致其可能不理解物理法则并产生幻觉[15][16] - 真正的下一代智能体系统需从回答问题转向完成任务,具备记忆、推理、自主决策规划等能力,并必须拥有感知能力,需要一个统一的动态系统来理解世界[16] - 最终目标是打造一个具备物理一致性和时空连贯性的虚拟宇宙,实现AI能力的本质跨越,并将模型无缝嵌入智能终端融入生活[16]