
中国AI开源模型发展 - MoonShot最新开源大模型K2总参数规模达到万亿级别(1T),是目前开源模型中最大的,激活参数320亿 [2] - K2在基准测试SWE Bench Verified(编程)、Tau2(智能体)中仅次于Claude 4 Opus,在AceBench(工具调用)中仅次于GPT-4.1 [2] - K2官方API服务与DeepSeek的R1相当,但最大支持上下文长度(128K)高于R1(64K) [2] - K2发布后成为HuggingFace上热度第一的开源模型,新兴云厂商NovitaAI与Parasail已将其托管上线 [4] - Perplexity首席执行官Aravind Srinivas在内部测试后决定尽快对K2展开后训练 [4] 中国AI公司竞争格局 - 中国本土AI公司竞争激烈,MiniMax与MoonShot相互竞争,先后发布多款开源模型 [5] - MoonShot已披露融资总额约15亿美元,远低于硅谷同行 [6] - MoonShot比DeepSeek更早推动"执行"以更低成本落地,冲击AI应用的消费市场和企业市场 [7] - K2兼容OpenAI和Anthropic的API格式,凭借更高性价比可能赢得硅谷AI应用开发者市场 [7] MoonShot技术创新 - K2架构采用更少注意力头、更多专家,提高长上下文效率和每个token处理效率 [8] - MoonShot自研MuonClip优化器计算效率是AdamW优化器的2倍 [8] - MoonShot在MuonClip优化器中融入自研QK-Clip技术解决MaxLogit爆炸问题 [10][11] - MoonShot重视底层创新,曾提出MoBA(混合块注意力)架构 [11] MoonShot产品布局 - MoonShot拥有形式推理模式Kimina-Prover-72B、编程模型Kimi-Dev-72B、深度研究智能体Kimi-Researcher等多款产品 [12] - K2的智能体能力得益于大量Agentic合成数据和通用强化学习手段 [12] - MoonShot团队具有文艺特质,公司名来源于平克·弗洛伊德的专辑 [13]