Workflow
二次创新
icon
搜索文档
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
虎嗅· 2025-06-17 20:15
模型发布与性能表现 - 月之暗面发布开源代码模型Kimi-Dev-72B,在SWE-bench Verified基准测试中取得60.4%的成绩,创开源模型新纪录,超越DeepSeek等竞争对手 [1] - Kimi-Dev-72B基于阿里巴巴Qwen团队的Qwen2.5-72B模型二次开发,明确标注Base model为Qwen/Qwen2.5-72B [2] - 模型创新主要体现在训练方法上,采用大规模强化学习技术,在Docker环境中自主修复真实代码仓库问题,确保生成代码符合实际开发标准 [3] 技术细节与许可协议 - Kimi-Dev-72B采用MIT协议发布,但其基础模型Qwen-2.5-72B需遵守《通义千问许可协议》,形成"delta权重"发布模式 [4][5] - Qwen2.5系列采用分级许可体系,72B模型包含商业限制条款,要求月活跃用户超1亿时需申请商业授权 [6][7] - Qwen团队后续澄清此为"历史遗留问题",Qwen3系列已全面转向Apache 2.0协议,取消商业限制 [8][10][12] 行业趋势与协作模式 - 训练70B参数级别模型成本达数百万美元,月之暗面选择基于Qwen2.5-72B进行二次开发,集中资源强化核心优势 [15] - 开源策略从限制性许可向完全开放转变,Apache 2.0协议促进商业友好、无限制使用和社区驱动 [17] - 基于优秀基础模型的"二次创新"兴起,大厂与创业公司在开源生态中形成新协作模式 [16][18] 模型应用与改进空间 - 尽管Kimi-Dev在基准测试中表现优异,实际应用中生成的代码有时需调试,对复杂需求理解仍有不足 [16] - 开源社区认为Kimi-Dev的开放权重和透明分享对社区有益,但模型消费者仍需遵守基础模型许可 [15]