月之暗面Kimi K2大模型发布 - 7月12日月之暗面发布最新大模型Kimi K2 模型权重和代码全部开源 在LMArena排行榜中综合排名全球第五 开源大模型中位居全球第一 超越Claude 4和DeepSeek-R1-0528 [2] - Kimi K2提出"模型即Agent"新概念 原生具有调用各种工具的能力 在LiveCodeBench测试中取得53.7%的成绩 超越GPT-4.1的44.7%和Claude 3.5 Opus的47.4% [23][35][44] - Kimi K2参数量扩展至1T量级 放弃自研架构转向DeepSeek V3 通过减少Attention Heads数量增加Experts数量 突破智能上限 [24][28][29] Kimi发展历程与战略转型 - 月之暗面曾是Scaling Law忠实信徒 采取激进买量策略 2024年营销预算接近9亿人民币 但6月月活降至2352万 同比下降2.19% [8][11][17] - 2024年底全球高质量公开数据耗尽 深度求索通过DeepSeek R1开辟新范式 依靠后训练强化学习突破智能上限 月活暴涨至6181万 [13][16][17] - 2025年初公司停掉所有市场营销 集中资源研发K2 转向技术驱动 加入开源阵营 战略重心回归大模型性能提升 [55] Kimi K2技术创新 - 开发MuonClip优化器 解决15.5T tokens预训练稳定性问题 实现零崩溃表现 被海外AI圈称为"完美的Loss曲线" [32][33] - 提出Agent训练新路径 通过AI生成模拟场景合成数百个垂直领域工具调用轨迹 建立自动化Agent数据生产工厂 [38][39][41] - 模型架构上减少DeepSeek V3的Attention Heads 增加Experts数量 在算力有限情况下最大化模型潜力 [28][29] 行业影响与竞争格局 - DeepSeek R1引发AI创业公司存在主义危机 其不花营销预算单靠产品实力月活达6181万 促使行业重新思考发展路径 [17][54] - Kimi K2开源后迅速被阿里Qwen反超 但公司战略转型意义重大 体现从产品驱动转向技术驱动的决心 [55] - 行业验证"模型能力决定市场认可"逻辑 AI公司价值创造核心转向付费用户关注的效率和结果 [53][54]
Kimi K2拿到了世界第一,也杀死了过去的自己
新财富·2025-07-28 10:58