AI产业跟踪：月之暗面发布并开源KimiK2Thinking，关注国内大模型推理能力迭代进展

行业投资评级 - 投资评级：看好，维持 [8] 核心观点 - 月之暗面发布并开源Kimi K2 Thinking模型，其为具有通用Agentic能力和推理能力的思考模型，是Kimi迄今能力最强的开源思考模型 [2] - 模型基于"模型即Agent"理念训练，原生掌握"边思考，边使用工具"的能力，无需人类干预即可自主实现高达300轮的工具调用和持续稳定的多轮思考能力 [2] - 考虑到成本是制约token消耗量的核心因素，Kimi K2 Thinking的出现有望开辟降本新范式 [2] - 继续看好国产AI产业链，持续重点推荐铲子股和卡位优势显著的巨头本身 [2] 模型能力与技术特点 - 推理性能全面提升：在HLE测试中以44.9%准确率超过GPT-5（41.7%）取得SOTA成绩 [10] - 自主搜索与浏览能力：BrowseComp测试得分60.2%（人类平均得分29.2%），超越GPT-5（54.9%）拿下SOTA，在BrowseComp-ZH、SEAL-0、FinSearchComp-T3等基准测试中均拿下SOTA成绩 [10] - Agentic编程能力增强：在Tau2 Bench Telecom基准测试中以93%分位列第一，在SWE-Multilingual、SWE-bench Verified、LiveCodeBench V6测试得分分别为61%、71%、83% [10] - 受益于长程规划和自主搜索能力提升，推理表现更稳定：可借助多达上百轮的"思考→搜索→浏览网页→思考→编程"动态循环，持续提出并完善假设、验证证据、进行推理 [10] - 通用基础能力升级：是少数具有多工具调用能力的开源模型，在无人干预情况下可连续调用200-300次工具 [10] - 工程落地层面提升推理效率与硬件兼容性：采用原生INT4量化，在后训练阶段采用量化感知训练（QAT），并对MoE组件应用INT4纯权重量化，使得模型支持原生INT4推理，生成速度提升约2倍 [10] 模型规格与定价 - 模型规格：MoE架构，总参数量1T，激活参数量32B，上下文长度256K，更好支持国产GPU [5] - 定价策略：价格与KimiK2-0905相同，输入4元/百万tokens，输出16元/百万tokens，命中缓存的输入为1元 [10] - 速度优化：提供速度高达100 Token/s的Turbo API，输入8元/百万tokens，输出58元/百万tokens，命中缓存的输入为1元 [10] - 模型定价略高于同期上新的Minimax-M2 [10]