国产模型有点东西

行业趋势 - 今年被视作国产AI发展的关键年份，多位顶尖人才回国推动行业进步 [1] 小米MiMo-V2-Flash模型发布 - 小米于12月17日正式发布并开源新模型MiMo-V2-Flash，采用MIT开源协议，基础版权重已在Hugging Face发布 [1] - 模型采用专家混合架构，总参数3090亿，活跃参数150亿 [1] - 模型性能可与DeepSeek-V3.2竞争，在AIME 2025数学竞赛和GPQA-Diamond科学知识测试中位列开源模型前两名 [6] - 编程能力表现突出，在SWE-bench Verified测试中得分73.4%，超越所有开源模型，接近GPT-5-High水平 [6] 模型成本与效率优势 - 推理速度达到150 tokens/秒，成本降至每百万token输入0.1美元、输出0.3美元 [1] - 与海外主流模型相比，成本便宜一个量级，比国内DeepSeek模型便宜一半以上 [6] - 在OpenRouter的企业级调用数据中，上线两周后流量冲至第三位，达到3980亿，显示出强劲的市场接受度 [11][12] 核心技术创新 - 采用混合滑动窗口注意力机制，以5层滑动窗口注意力搭配1层全局注意力的激进比例交替使用，滑动窗口仅看128个token [7][8] - 该设计使KV缓存存储量减少近6倍，同时支持最长256k上下文窗口且长文本性能未打折扣 [9] - 集成三层MTP模块，可并行预测多个token，使平均接受长度超过3，编码任务速度提升约2.5倍，有效减少GPU空转 [10] - 采用多教师在线策略蒸馏技术，仅需传统方法1/50的算力即可让学生模型达到教师性能峰值，支持构建自我进化的闭环系统 [10]