DeepSeek终于丢了开源第一王座,但继任者依然来自中国
猿大侠·2025-07-19 11:43
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追顶尖闭源模型Grok 4 [1] - 开源模型DeepSeek R1位列总榜第八,与Kimi K2成为唯二进入TOP 10的开源模型且均来自中国 [2] - Kimi K2在多项能力中表现突出:连续多轮对话并列第一、编程能力第二、应对复杂提示词能力第二 [3] 社区热度与行业认可 - Kimi K2发布一周内GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开支持Kimi K2,透露计划基于该模型进行后训练 [5] - 用户访问量激增导致API响应延迟,反映模型热度极高 [6] 架构设计与技术优化 - Kimi K2继承DeepSeek V3架构,但通过四项关键参数调整优化性能:增加专家数量、注意力头减半、仅保留第一层Dense、专家无分组 [12] - 调整后总参数增至1.5倍,但推理耗时理论值更低,成本与V3架构相当 [13] - 团队选择V3架构因其已验证高效且符合有限资源条件,避免"为不同而不同" [10][11] 开源模型行业趋势 - 开源模型性能差距缩小,TOP 10模型总分均超1400分,开源与闭源近乎同一起跑线 [20][21] - 行业专家预测开源将更普遍击败闭源,并在AI本地化定制中发挥关键作用 [24] - 开源模型打破"性能弱"刻板印象,国产开源模型表现尤为亮眼 [18][22]