计算机行业AI模型系列（三）：性能跃升，国产算力适配加快

行业投资评级 - 计算机行业评级为“买入” [2] 核心观点 - 国产AI模型性能显著跃升：2026年4月，DeepSeek发布V4系列模型，Kimi发布K2.6模型，在长上下文、Agent能力、世界知识和推理性能上实现国内与开源领域的领先 [7][16] - “国产算力+国产模型”自主可控建设加快：DeepSeek V4和Kimi K2.6在发布后迅速与华为昇腾、寒武纪思元、壁仞等国产AI芯片适配，标志着国产AI产业从芯片单向适配向模型与算力“双向奔赴”转变 [7][18] - 拉动国产算力产业链需求：新模型的推出预计将显著拉动国产AI芯片、CPU、服务器超节点、算力租赁/IDC及算力调度等环节的需求 [7][19][22] 根据目录总结一、DeepSeek V4发布：长上下文能力突破 - 模型架构创新：引入CSA（压缩稀疏注意力）和HCA（高度压缩注意力）混合注意力机制，结合KV cache压缩、FP4量化等技术，大幅降低长上下文计算与存储成本。在百万token场景下，V4-Pro单token推理算力降至V3.2的27%，KV cache占用降至10%；V4-Flash进一步压缩至10%和7% [7][30][33][44][54] - 模型性能：在开源模型中处于第一梯队，长上下文效率优势明确。V4-Pro-Max在部分评测中接近闭源前沿模型，但在通用知识和复杂Agent任务上与GPT-5.4、Gemini-3.1等仍有差距 [43][44][56] - 价格与效率：具备显著成本优势。V4-Pro支持1M上下文，缓存未命中输入/输出价格分别为12元/24元每百万token，低于海外同类模型（如GPT-5.5为$5/$30）。V4-Flash价格更低，为成本敏感型场景提供高性价比路径 [50][54][56] 二、Kimi K2.6发布，全面精进代码和Agent集群能力 - 模型架构创新：技术主线围绕Agentic Coding、多模态理解和并行任务编排展开。通过Agent Swarm机制，可将复杂任务拆解为多达300个子Agent并行执行，支持长达12小时以上连续执行、超4000次工具调用 [7][59][62] - 模型性能：差异化体现在长程代码、复杂工程任务和自主Agent执行。在企业和开发者侧反馈中，代码生成准确率、长上下文稳定性及工具调用成功率均有显著提升 [62][63] - 与DeepSeek V4对比：代表两条不同升级路径。Kimi K2.6更强调多模态Agent执行和长程工程能力，适合代码Agent、长时间自主执行等复杂工作流；DeepSeek V4重点在于底层架构效率，适合超长文档、代码库级理解及低成本大规模调用场景 [17][71][72] 三、国产算力适配加快，推动算力国产替代进程 - 国产AI芯片全面适配：华为昇腾、寒武纪、壁仞等国产AI芯片在DeepSeek V4和Kimi K2.6发布第一时间完成适配，涉及软件栈优化、算子加速及硬件协同 [18][74][75][82][86] - 测算新增算力需求：假设DeepSeek V4和Kimi K2.6日均调用量为40万亿至70万亿tokens，为支持其推理需求，预计市场将新增采购AI加速卡11万至47万张、CPU 5万至24万颗、超节点283至1236台 [7][20][91][103] - 带动算力租赁/IDC与调度需求：模型API价格下降有望推动Token消费量指数级增长，进而直接利好算力租赁/IDC和算力调度环节。当前国内算力资源存在利用率低、弹性需求高、区域错配及异构资源管控难等特点，为算力调度平台发展创造空间 [22][107][109][114][119] 四、投资建议 - 芯片：推荐寒武纪和国产CPU龙头公司 [7][23] - 服务器：推荐浪潮信息、紫光股份，建议关注神州数码 [7][23] - 应用端：推荐卓易信息 [7][23] - 软件端：推荐星环科技、范式智能、税友股份、汉得信息、中望软件、赛意信息，建议关注软通动力和中国软件国际 [7][23] - 算力租赁和算力调度：建议关注拓维信息、首都在线、网宿科技、优刻得、宏景科技、宝信软件、云赛智联、铜牛信息、卡莱特、思特奇、并行科技等 [7][23]