Kimi K2基础大模型

搜索文档
【兴证计算机】AI产业跟踪:大模型密集升级,关注WAIC2025
兴业计算机团队· 2025-07-20 22:31
周观点 - 计算机板块Q2业绩呈现改善趋势 截至目前共有77家公司完成业绩预告 占比23% 按整体法 Q2营收同比增速为-1% 高于上半年的-6% 归母利润为-2 43亿元 同比减亏6 11亿元 扣非利润为-8 73亿元 同比减亏4 9亿元 按中位数法 Q2营收同比增速为8% 高于上半年的-5% [2] - AI产业催化不断 建议持续加仓AI算力及应用 政策端工信部将出台多个行业数字化转型方案 组织"人工智能+软件"行动 产业端Kimi发布K2基础大模型 性能及成本优化显著提升 OpenAI推出ChatGPT智能体系统 WAIC 2025将于7月26日在上海开幕 [2] 深度跟踪 - AI产业跟踪显示大模型密集升级 Kimi K2基础大模型在性能 成本优化及Agent工具调用等方面有显著提升 同时需关注WAIC 2025行业盛会 [3]
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
量子位· 2025-07-12 12:57
Kimi K2模型发布 - 发布全新Kimi K2基础大模型,采用MoE架构,总参数1T,激活参数32B,能力领先性体现在代码、Agent、数学推理任务上[2] - 模型支持128K上下文,在SWE Bench Verified、Tau2、AceBench等基准测试中取得开源模型SOTA成绩[9][11] - 模型发布即开源,提供Kimi-K2-Base基础预训练模型和Kimi-K2-Instruct指令微调版本,遵循修改版MIT协议[4][25][26] 技术能力提升 - 代码能力显著提升,支持粒子系统、可视化和3D场景开发,可生成山川峡谷3D景观和3D粒子星系模拟[17][18][19] - Agent工具调用能力增强,具备复杂指令解析能力,可自动拆解需求为可执行的ToolCall结构[22] - 数学等科学能力得到优化,通过通用强化学习和自我评价机制解决不可验证任务的奖励稀缺问题[14][34] 技术创新细节 - 采用MuonClip优化器替代传统Adam优化器,提升训练稳定性和token使用效率,完成15.5T token平稳训练[29][30][31] - 构建大规模Agentic Tool Use数据合成pipeline,覆盖数百领域数千工具,由LLM评估筛选高质量样本[32] - 通过可验证任务持续优化critic,提升泛化任务表现[34] 市场格局变化 - 2024年AI智能助手Web端市场形成Kimi智能助手、豆包AI和文心一言TOP 3格局,占据70%市场份额[56] - APP端豆包和Kimi智能助手断崖式领先,市场份额占比80%[58] - DeepSeek R1发布后市场格局巨变,形成字节豆包、DeepSeek、Kimi、腾讯元宝(DDTK)新格局[60] 公司战略调整 - Kimi通过K2开源大模型回应市场质疑,明确不放弃自研大模型的战略方向[67] - 公司选择打造更强开源大模型,追求全维度SOTA,重新证明技术领先性[68] - 模型开源策略可能改变行业竞争格局,此前已有2家"六小龙"公司放弃大模型自研[66]