国产模型有点东西

行业趋势 - 今年被视作国产AI发展的关键年份,多位顶尖人才回国推动行业进步 [1] 小米MiMo-V2-Flash模型发布 - 小米于12月17日正式发布并开源新模型MiMo-V2-Flash,采用MIT开源协议,基础版权重已在Hugging Face发布 [1] - 模型采用专家混合架构,总参数3090亿,活跃参数150亿 [1] - 模型性能可与DeepSeek-V3.2竞争,在AIME 2025数学竞赛和GPQA-Diamond科学知识测试中位列开源模型前两名 [6] - 编程能力表现突出,在SWE-bench Verified测试中得分73.4%,超越所有开源模型,接近GPT-5-High水平 [6] 模型成本与效率优势 - 推理速度达到150 tokens/秒,成本降至每百万token输入0.1美元、输出0.3美元 [1] - 与海外主流模型相比,成本便宜一个量级,比国内DeepSeek模型便宜一半以上 [6] - 在OpenRouter的企业级调用数据中,上线两周后流量冲至第三位,达到3980亿,显示出强劲的市场接受度 [11][12] 核心技术创新 - 采用混合滑动窗口注意力机制,以5层滑动窗口注意力搭配1层全局注意力的激进比例交替使用,滑动窗口仅看128个token [7][8] - 该设计使KV缓存存储量减少近6倍,同时支持最长256k上下文窗口且长文本性能未打折扣 [9] - 集成三层MTP模块,可并行预测多个token,使平均接受长度超过3,编码任务速度提升约2.5倍,有效减少GPU空转 [10] - 采用多教师在线策略蒸馏技术,仅需传统方法1/50的算力即可让学生模型达到教师性能峰值,支持构建自我进化的闭环系统 [10]

国产模型有点东西 - Reportify