Kimi K2模型发布 - 发布全新Kimi K2基础大模型,采用MoE架构,总参数1T,激活参数32B,能力领先性体现在代码、Agent、数学推理任务上[2] - 模型支持128K上下文,在SWE Bench Verified、Tau2、AceBench等基准测试中取得开源模型SOTA成绩[9][11] - 模型发布即开源,提供Kimi-K2-Base基础预训练模型和Kimi-K2-Instruct指令微调版本,遵循修改版MIT协议[4][25][26] 技术能力提升 - 代码能力显著提升,支持粒子系统、可视化和3D场景开发,可生成山川峡谷3D景观和3D粒子星系模拟[17][18][19] - Agent工具调用能力增强,具备复杂指令解析能力,可自动拆解需求为可执行的ToolCall结构[22] - 数学等科学能力得到优化,通过通用强化学习和自我评价机制解决不可验证任务的奖励稀缺问题[14][34] 技术创新细节 - 采用MuonClip优化器替代传统Adam优化器,提升训练稳定性和token使用效率,完成15.5T token平稳训练[29][30][31] - 构建大规模Agentic Tool Use数据合成pipeline,覆盖数百领域数千工具,由LLM评估筛选高质量样本[32] - 通过可验证任务持续优化critic,提升泛化任务表现[34] 市场格局变化 - 2024年AI智能助手Web端市场形成Kimi智能助手、豆包AI和文心一言TOP 3格局,占据70%市场份额[56] - APP端豆包和Kimi智能助手断崖式领先,市场份额占比80%[58] - DeepSeek R1发布后市场格局巨变,形成字节豆包、DeepSeek、Kimi、腾讯元宝(DDTK)新格局[60] 公司战略调整 - Kimi通过K2开源大模型回应市场质疑,明确不放弃自研大模型的战略方向[67] - 公司选择打造更强开源大模型,追求全维度SOTA,重新证明技术领先性[68] - 模型开源策略可能改变行业竞争格局,此前已有2家"六小龙"公司放弃大模型自研[66]
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
量子位·2025-07-12 12:57