行业投资评级 - 投资评级为“看好”,并维持该评级 [8] 报告核心观点 - AI应用正当时,月之暗面发布Kimi-K2.6模型,API提价,看好模型需求继续拐点向上 [1][5] - 模型能力显著提升,API定价上调体现了模型能力跃升与商业化信心,并有望驱动Token需求规模化放量 [11] 模型技术架构与性能 - 万亿MoE稀疏计算架构:采用MoE架构,总参数1万亿(1T),激活参数320亿(32B),拥有384个专家,每token激活8个,兼顾能力与成本 [2][5][11] - 长上下文与训练优化:模型搭载MLA注意力机制,通过压缩KV Cache降低长上下文显存压力,支持256K上下文一次解析;训练端使用MuonClip优化器,实现15.5万亿Token零尖峰稳定训练 [11] - 多模态融合:自研MoonViT 400M视觉编码器,实现图文视频与文本、代码的深度融合 [11] 代码与长程工程能力 - 代码性能对标顶尖模型:Kimi K2.6是月之暗面迄今最强的代码模型,在Terminal-Bench 2.0(66.7分)、SWE-Bench Pro(58.6分)等基准测试中取得领先或第一梯队成绩 [11] - 内部与第三方评测优异:内部Kimi Code Bench测试成绩较K2.5显著提升约20%;第三方企业Factory.ai评价其“对指令的理解更准确,写代码时出错更少” [11] - 长程复杂工程实例: - 使用冷门Zig语言部署并优化Qwen3.5-0.8B模型,经12小时、14轮迭代、4000余次工具调用,吞吐量从约15提升至约193 tokens/s [11] - 成功重构拥有8年历史的开源金融引擎,历时13小时,修改超4000行代码 [11] - 代码与视觉融合:可将简单提示转化为含美学与交互动画的专业级前端界面,支持图像与视频生成工具调用及全栈开发流程 [11] Agent与办公自动化能力 - Agent基准测试领先:在DeepSearchQA测试中f1-score达92.5,领先GPT-5.4(78.6);BrowseComp得分83.2,整体性能持平或优于GPT-5.4、Claude Opus 4.6与Gemini 3.1 Pro [11] - Agent集群能力大幅提升:Agent Swarm从支持100个子Agent/1500步协调,扩容至300个子Agent/4000协调步骤,可动态分解复杂任务并由领域专属Agent并行执行 [11] - 长周期运行与生态协同:与OpenClaw、Hermes Agent协同支持5天持续运行;Claw Groups开放内测,K2.6作为协调器动态匹配任务并处理失败重分配 [11] - 办公端到端自动化:可将任意文档转化为可复用Skills,内置上百官方技能,一次性完成从深度搜索、文档分析到生成网页、PPT、表格的全流程自动化 [11] 商业化与投资机会 - API定价显著上调:Kimi-K2.6 API输入价格(缓存命中/未命中)为1.10/6.50元/百万tokens,输出价格为27.00元/百万tokens,较K2.5分别上调57%/63%/29% [11] - Token需求有望放量:Agent Swarm单任务支持4000余次工具调用,token消耗呈指数级增长,叠加多模态场景渗透,用量有望进入规模化放量周期 [11] - 重点关注方向: 1. 国产算力链,受益于推理算力需求刚性增长 [11] 2. 云侧MaaS(模型即服务)业务有望加速渗透 [11] 3. 模型厂商加速商业化 [11]
AI应用正当时:月之暗面发布Kimi-K2.6,API提价,看好模型需求继续拐点向上
长江证券·2026-04-27 20:12