行业投资评级 - 计算机行业评级为“买入” [2] 核心观点 - 国产AI模型性能显著跃升:2026年4月,DeepSeek发布V4系列模型,Kimi发布K2.6模型,两者在长上下文、Agent能力和推理性能上实现国内与开源领域的领先 [7][16] - “国产算力+国产模型”自主可控建设加快:DeepSeek V4和Kimi K2.6在发布第一时间即选择与华为昇腾、寒武纪思元、壁仞等国产AI芯片适配,标志着国产AI产业从芯片单向适配向模型与算力“双向奔赴”转变 [7][18][88] - 有望拉动国产算力产业链需求:新模型的推出预计将带动国产AI芯片、CPU、服务器超节点、算力租赁/IDC及算力调度等环节的新增需求 [7][19][22] 模型技术要点总结 DeepSeek V4 - 核心突破:引入百万字(1M token)超长上下文能力,通过混合注意力机制(CSA/HCA)、KV cache压缩和FP4量化等技术,大幅降低长序列计算与存储成本 [26][30][33] - 性能数据:在百万token场景下,V4-Pro单token推理算力降至V3.2的27%,KV cache占用降至10%;V4-Flash则进一步压缩至10%和7% [7][45] - 模型规格:V4-Pro总参数1.6T,激活参数49B;V4-Flash总参数284B,激活参数13B [26] - 价格优势:V4-Pro支持1M上下文,缓存未命中输入/输出价格分别为12元/24元每百万token,相比海外同类模型(如GPT-5.5 API为$5/$30每百万token)具备成本优势 [51][55] Kimi K2.6 - 核心突破:强调长程代码任务、多模态Agent执行和Agent Swarm编排能力,可将复杂任务拆解为多个并行子任务执行 [7][59][60] - 性能示例:在官方示例中,K2.6曾完成12小时以上连续执行、4000多次工具调用和14轮迭代的模型推理任务 [7][63] - 模型规格:支持256K上下文,支持文本、图像和视频输入 [59] - 价格定位:缓存未命中输入价格为6.50元每百万token,输出为27.00元每百万token [67] 模型路径对比 - DeepSeek V4:重点优化底层架构效率,通过技术手段压低百万上下文的计算与存储成本,适合超长文档、代码库级理解及成本敏感型大规模调用场景 [17][71][72] - Kimi K2.6:更强调多模态Agent执行和长程工程能力,通过Agent Swarm提高真实工作流的完成率,适合代码Agent、长时间自主执行及多Agent并行协作的复杂工作流场景 [17][71][72] 国产算力适配与产业链影响 算力适配进展 - 全面适配国产芯片:DeepSeek V4和Kimi K2.6已与华为昇腾、寒武纪、壁仞等国产AI芯片实现发布即适配(Day-0适配) [7][75][88] - 软硬件协同优化:华为昇腾通过CANN计算架构、低精度计算(如FP8、MXFP4)和超节点产品优化推理性能;寒武纪通过自研算子库和硬件加速能力实现高效运行 [76][79][82] - 生态意义:打破了英伟达CUDA的生态壁垒,开辟了国产大模型适配国产算力的新方向,加速产业自主可控建设 [18][88] 新增算力需求测算 - 测算基础:假设DeepSeek V4和Kimi K2.6模型日均tokens调用量为40万亿至70万亿tokens [20][91] - 需求预测:为支持上述推理需求,预计市场将新增采购AI加速卡11万至47万张;新增CPU 5万至24万颗;新增超节点283至1236台 [7][20][103] - 测算依据:参考国内AI大模型日均Tokens消耗量已达140万亿(截至2026年3月底),以及豆包大模型日均调用量达120万亿(2026年3月)的趋势 [92][96] 对产业链各环节的拉动 - 芯片:直接拉动国产AI加速卡需求,同时Agent场景的应用有望增加对CPU的需求 [19][106] - 服务器/超节点:昇腾等国产超节点产品(如Atlas 900 A3 SuperPod)有望随着模型应用而放量 [19][79][106] - 算力租赁/IDC与调度:模型调用量激增将直接带动算力需求,同时算力资源利用率低、区域错配、异构资源管控难等现状提升了算力调度平台的重要性 [22][107][109][119] 投资建议 - 芯片:推荐寒武纪和国产CPU龙头公司 [7][23] - 服务器:推荐浪潮信息、紫光股份,建议关注神州数码 [7][23] - 应用端:推荐卓易信息 [7][23] - 软件端:推荐星环科技、范式智能、税友股份、汉得信息、中望软件、赛意信息,建议关注软通动力和中国软件国际 [7][23] - 算力租赁与调度:建议关注拓维信息、首都在线、网宿科技、优刻得、宏景科技、宝信软件、云赛智联、铜牛信息、卡莱特、思特奇、并行科技等 [7][23]
计算机行业AI模型系列(三):DeepSeek V4 和 Kimi K2.6:性能跃升,国产算力适配加快