报告行业投资评级 - 强于大市 [1] 报告的核心观点 - 2025年7月11日月之暗面发布并开源大模型Kimi K2 其总参数量达1万亿 每次推理仅激活320亿参数 在代码能力和通用Agent任务处理上表现突出 实现了性能与成本的平衡 输入输出价格更具优势 [1][2][6] - Kimi K2的发布标志着国产AI在全球竞争中的全新突破 为开发者与用户提供了无限可能 [2][27] 根据相关目录分别进行总结 全球最大参数模型Kimi K2发布 - 2025年7月11日月之暗面发布并开源大模型Kimi K2 总参数量达1万亿Token 每次推理激活320亿参数 在代码能力和通用Agent任务处理方面表现出色 [6][8] - 月之暗面由杨植麟于2023年4月创立 产品迭代轨迹清晰 2023 - 2025年先后推出智能助手Kimi、k0 - math数学模型、k1视觉思考模型、k1.5多模态模型等 功能不断升级 [6][7] 深入剖析Kimi K2 Kimi K2从框架到训练的技术突破 - Kimi K2框架设计与DeepSeek V3/R1相似 但核心参数配置差异显著 K2配备64个attention heads与384个专家 减少自注意力计算复杂度 提升推理速度和长文本处理效率 扩展知识覆盖范围和多任务适配能力 [11] - Kimi K2借助MuonClips优化器实现万亿参数模型的高效训练(15.5 Trillion Tokens) 全程无训练峰值 提高Token利用效率 [13] - Kimi K2采用大规模Agentic数据合成策略 学习复杂工具调用能力 提供Kimi K2 Base和Kimi K2 Instruct两个版本 并引入自我评价机制解决不可验证任务的奖励稀缺问题 [15] Kimi K2性能达到行业领先水平 - Kimi K2在自主编程、工具调用、数学等复杂智能任务上表现突出 性能达到行业领先水平 [18] - Kimi K2是性能与成本平衡的大规模模型 相较于GPT - 4.5、SparkDesk - v1.1、Llama - 3.1等模型 通过更精准的参数激活与架构优化控制成本 输入、输出价格分别为0.6/Million Tokens [22] Kimi K2的应用场景广泛 - Kimi K2应用场景广泛 涵盖代码与软件研发、数据推理及科研辅助、创意性写作等领域 [24] - 在代码与软件开发方面 支持一次性阅读上万行源码或整份需求文档 生成完整项目框架 提高开发效率 [24] - 在数学推理与科研辅助领域 在AIME、MATH等基准测试中领先主流开源模型 可给出分步推导 加速研究进程 [26] - 在创意性写作方面 在短篇小说创意写作评估中位列榜首 ELO Score达1638.2 超过Claude、DeepSeek等模型 [26]
人工智能月度跟踪:全球最大参数模型KimiK2发布-20250722
爱建证券·2025-07-22 20:59