AI产业跟踪:月之暗面发布并开源KimiK2Thinking,关注国内大模型推理能力迭代进展

行业投资评级 - 投资评级:看好,维持 [8] 核心观点 - 月之暗面发布并开源Kimi K2 Thinking模型,其为具有通用Agentic能力和推理能力的思考模型,是Kimi迄今能力最强的开源思考模型 [2] - 模型基于"模型即Agent"理念训练,原生掌握"边思考,边使用工具"的能力,无需人类干预即可自主实现高达300轮的工具调用和持续稳定的多轮思考能力 [2] - 考虑到成本是制约token消耗量的核心因素,Kimi K2 Thinking的出现有望开辟降本新范式 [2] - 继续看好国产AI产业链,持续重点推荐铲子股和卡位优势显著的巨头本身 [2] 模型能力与技术特点 - 推理性能全面提升:在HLE测试中以44.9%准确率超过GPT-5(41.7%)取得SOTA成绩 [10] - 自主搜索与浏览能力:BrowseComp测试得分60.2%(人类平均得分29.2%),超越GPT-5(54.9%)拿下SOTA,在BrowseComp-ZH、SEAL-0、FinSearchComp-T3等基准测试中均拿下SOTA成绩 [10] - Agentic编程能力增强:在Tau2 Bench Telecom基准测试中以93%分位列第一,在SWE-Multilingual、SWE-bench Verified、LiveCodeBench V6测试得分分别为61%、71%、83% [10] - 受益于长程规划和自主搜索能力提升,推理表现更稳定:可借助多达上百轮的"思考→搜索→浏览网页→思考→编程"动态循环,持续提出并完善假设、验证证据、进行推理 [10] - 通用基础能力升级:是少数具有多工具调用能力的开源模型,在无人干预情况下可连续调用200-300次工具 [10] - 工程落地层面提升推理效率与硬件兼容性:采用原生INT4量化,在后训练阶段采用量化感知训练(QAT),并对MoE组件应用INT4纯权重量化,使得模型支持原生INT4推理,生成速度提升约2倍 [10] 模型规格与定价 - 模型规格:MoE架构,总参数量1T,激活参数量32B,上下文长度256K,更好支持国产GPU [5] - 定价策略:价格与KimiK2-0905相同,输入4元/百万tokens,输出16元/百万tokens,命中缓存的输入为1元 [10] - 速度优化:提供速度高达100 Token/s的Turbo API,输入8元/百万tokens,输出58元/百万tokens,命中缓存的输入为1元 [10] - 模型定价略高于同期上新的Minimax-M2 [10]

AI产业跟踪:月之暗面发布并开源KimiK2Thinking,关注国内大模型推理能力迭代进展 - Reportify