行业投资评级 - 计算机行业评级为“买入” [2] 核心观点 - 国产AI模型性能显著跃升:2026年4月,DeepSeek发布V4系列模型,Kimi发布K2.6模型,在长上下文、Agent能力、世界知识和推理性能上实现国内与开源领域的领先 [7][16] - “国产算力+国产模型”自主可控建设加快:DeepSeek V4和Kimi K2.6在发布后迅速与华为昇腾、寒武纪思元、壁仞等国产AI芯片适配,标志着国产AI产业从芯片单向适配向模型与算力“双向奔赴”转变 [7][18] - 拉动国产算力产业链需求:新模型的推出预计将显著拉动国产AI芯片、CPU、服务器超节点、算力租赁/IDC及算力调度等环节的需求 [7][19][22] 根据目录总结 一、DeepSeek V4发布:长上下文能力突破 - 模型架构创新:引入CSA(压缩稀疏注意力)和HCA(高度压缩注意力)混合注意力机制,结合KV cache压缩、FP4量化等技术,大幅降低长上下文计算与存储成本。在百万token场景下,V4-Pro单token推理算力降至V3.2的27%,KV cache占用降至10%;V4-Flash进一步压缩至10%和7% [7][30][33][44][54] - 模型性能:在开源模型中处于第一梯队,长上下文效率优势明确。V4-Pro-Max在部分评测中接近闭源前沿模型,但在通用知识和复杂Agent任务上与GPT-5.4、Gemini-3.1等仍有差距 [43][44][56] - 价格与效率:具备显著成本优势。V4-Pro支持1M上下文,缓存未命中输入/输出价格分别为12元/24元每百万token,低于海外同类模型(如GPT-5.5为$5/$30)。V4-Flash价格更低,为成本敏感型场景提供高性价比路径 [50][54][56] 二、Kimi K2.6发布,全面精进代码和Agent集群能力 - 模型架构创新:技术主线围绕Agentic Coding、多模态理解和并行任务编排展开。通过Agent Swarm机制,可将复杂任务拆解为多达300个子Agent并行执行,支持长达12小时以上连续执行、超4000次工具调用 [7][59][62] - 模型性能:差异化体现在长程代码、复杂工程任务和自主Agent执行。在企业和开发者侧反馈中,代码生成准确率、长上下文稳定性及工具调用成功率均有显著提升 [62][63] - 与DeepSeek V4对比:代表两条不同升级路径。Kimi K2.6更强调多模态Agent执行和长程工程能力,适合代码Agent、长时间自主执行等复杂工作流;DeepSeek V4重点在于底层架构效率,适合超长文档、代码库级理解及低成本大规模调用场景 [17][71][72] 三、国产算力适配加快,推动算力国产替代进程 - 国产AI芯片全面适配:华为昇腾、寒武纪、壁仞等国产AI芯片在DeepSeek V4和Kimi K2.6发布第一时间完成适配,涉及软件栈优化、算子加速及硬件协同 [18][74][75][82][86] - 测算新增算力需求:假设DeepSeek V4和Kimi K2.6日均调用量为40万亿至70万亿tokens,为支持其推理需求,预计市场将新增采购AI加速卡11万至47万张、CPU 5万至24万颗、超节点283至1236台 [7][20][91][103] - 带动算力租赁/IDC与调度需求:模型API价格下降有望推动Token消费量指数级增长,进而直接利好算力租赁/IDC和算力调度环节。当前国内算力资源存在利用率低、弹性需求高、区域错配及异构资源管控难等特点,为算力调度平台发展创造空间 [22][107][109][114][119] 四、投资建议 - 芯片:推荐寒武纪和国产CPU龙头公司 [7][23] - 服务器:推荐浪潮信息、紫光股份,建议关注神州数码 [7][23] - 应用端:推荐卓易信息 [7][23] - 软件端:推荐星环科技、范式智能、税友股份、汉得信息、中望软件、赛意信息,建议关注软通动力和中国软件国际 [7][23] - 算力租赁和算力调度:建议关注拓维信息、首都在线、网宿科技、优刻得、宏景科技、宝信软件、云赛智联、铜牛信息、卡莱特、思特奇、并行科技等 [7][23]
计算机行业AI模型系列(三):性能跃升,国产算力适配加快