Agentic Intelligence(智能体智能)

搜索文档
Kimi K2 不仅抢了开源第一,还抢了自家论文署名:我「夸」我自己
36氪· 2025-07-22 19:07
模型发布与市场地位 - 月之暗面发布全球首个万亿参数开源大模型Kimi K2 参数量达1.04T 激活参数32B 采用混合专家架构[1][12] - 模型在LMSYS开源排行榜位列第一 Arena Score达1420分 超越DeepSeek R1等竞争对手[2] - 前四名开源模型均为国产模型 显示中国在开源大模型领域的技术领先性[2] 技术创新与架构设计 - 采用MuonClip优化器解决超大规模训练稳定性问题 成功抑制logits值超过1000的现象[15][16] - 使用稀疏MoE架构 稀疏度为48 每个token仅激活8位专家[12] - 上下文窗口扩展至128K token 支持长文档处理与多轮工具调用[14] 数据策略与训练成果 - 训练数据规模达15.5T token 覆盖网页、代码、数学和知识领域 采用改写法增强数据多样性[12][17] - 通过合成数据与真实数据混合策略 构建10万条高质量工具使用轨迹 覆盖3000+真实工具与2万+合成工具[20][23] - 在代码任务中表现突出 LiveCodeBench v6达53.7分 SWE-bench Verified达51.8分[29] 性能表现与基准测试 - 在数学任务中MATH-500准确率达97.4% AIME 2024平均分达69.6分[29] - 通用任务MMLU得分92.9分 MMLU-Pro达81.2分 接近闭源模型水平[29] - 工具使用任务Tau2 retail平均分70.6分 AceBench准确率76.5分[29] 应用前景与行业影响 - 模型定位为"智能体时代"基础设施 专注于Agentic Intelligence能力开发[9] - 开源策略包括释放1T参数权重 为开发者提供完整模型访问权限[11] - 预计将推动2025年下半年垂直领域智能体应用发展 从聊天场景延伸至生产环境[31]