计算机行业AI模型系列（三）：DeepSeek V4 和 Kimi K2.6：性能跃升，国产算力适配加快

行业投资评级 - 计算机行业评级为“买入” [2] 核心观点 - 国产AI模型性能显著跃升：2026年4月，DeepSeek发布V4系列模型，Kimi发布K2.6模型，两者在长上下文、Agent能力和推理性能上实现国内与开源领域的领先 [7][16] - “国产算力+国产模型”自主可控建设加快：DeepSeek V4和Kimi K2.6在发布第一时间即选择与华为昇腾、寒武纪思元、壁仞等国产AI芯片适配，标志着国产AI产业从芯片单向适配向模型与算力“双向奔赴”转变 [7][18][88] - 有望拉动国产算力产业链需求：新模型的推出预计将带动国产AI芯片、CPU、服务器超节点、算力租赁/IDC及算力调度等环节的新增需求 [7][19][22] 模型技术要点总结 DeepSeek V4 - 核心突破：引入百万字（1M token）超长上下文能力，通过混合注意力机制（CSA/HCA）、KV cache压缩和FP4量化等技术，大幅降低长序列计算与存储成本 [26][30][33] - 性能数据：在百万token场景下，V4-Pro单token推理算力降至V3.2的27%，KV cache占用降至10%；V4-Flash则进一步压缩至10%和7% [7][45] - 模型规格：V4-Pro总参数1.6T，激活参数49B；V4-Flash总参数284B，激活参数13B [26] - 价格优势：V4-Pro支持1M上下文，缓存未命中输入/输出价格分别为12元/24元每百万token，相比海外同类模型（如GPT-5.5 API为$5/$30每百万token）具备成本优势 [51][55] Kimi K2.6 - 核心突破：强调长程代码任务、多模态Agent执行和Agent Swarm编排能力，可将复杂任务拆解为多个并行子任务执行 [7][59][60] - 性能示例：在官方示例中，K2.6曾完成12小时以上连续执行、4000多次工具调用和14轮迭代的模型推理任务 [7][63] - 模型规格：支持256K上下文，支持文本、图像和视频输入 [59] - 价格定位：缓存未命中输入价格为6.50元每百万token，输出为27.00元每百万token [67] 模型路径对比 - DeepSeek V4：重点优化底层架构效率，通过技术手段压低百万上下文的计算与存储成本，适合超长文档、代码库级理解及成本敏感型大规模调用场景 [17][71][72] - Kimi K2.6：更强调多模态Agent执行和长程工程能力，通过Agent Swarm提高真实工作流的完成率，适合代码Agent、长时间自主执行及多Agent并行协作的复杂工作流场景 [17][71][72] 国产算力适配与产业链影响算力适配进展 - 全面适配国产芯片：DeepSeek V4和Kimi K2.6已与华为昇腾、寒武纪、壁仞等国产AI芯片实现发布即适配（Day-0适配） [7][75][88] - 软硬件协同优化：华为昇腾通过CANN计算架构、低精度计算（如FP8、MXFP4）和超节点产品优化推理性能；寒武纪通过自研算子库和硬件加速能力实现高效运行 [76][79][82] - 生态意义：打破了英伟达CUDA的生态壁垒，开辟了国产大模型适配国产算力的新方向，加速产业自主可控建设 [18][88] 新增算力需求测算 - 测算基础：假设DeepSeek V4和Kimi K2.6模型日均tokens调用量为40万亿至70万亿tokens [20][91] - 需求预测：为支持上述推理需求，预计市场将新增采购AI加速卡11万至47万张；新增CPU 5万至24万颗；新增超节点283至1236台 [7][20][103] - 测算依据：参考国内AI大模型日均Tokens消耗量已达140万亿（截至2026年3月底），以及豆包大模型日均调用量达120万亿（2026年3月）的趋势 [92][96] 对产业链各环节的拉动 - 芯片：直接拉动国产AI加速卡需求，同时Agent场景的应用有望增加对CPU的需求 [19][106] - 服务器/超节点：昇腾等国产超节点产品（如Atlas 900 A3 SuperPod）有望随着模型应用而放量 [19][79][106] - 算力租赁/IDC与调度：模型调用量激增将直接带动算力需求，同时算力资源利用率低、区域错配、异构资源管控难等现状提升了算力调度平台的重要性 [22][107][109][119] 投资建议 - 芯片：推荐寒武纪和国产CPU龙头公司 [7][23] - 服务器：推荐浪潮信息、紫光股份，建议关注神州数码 [7][23] - 应用端：推荐卓易信息 [7][23] - 软件端：推荐星环科技、范式智能、税友股份、汉得信息、中望软件、赛意信息，建议关注软通动力和中国软件国际 [7][23] - 算力租赁与调度：建议关注拓维信息、首都在线、网宿科技、优刻得、宏景科技、宝信软件、云赛智联、铜牛信息、卡莱特、思特奇、并行科技等 [7][23]