DeepSeek永久降价：模型成本曲线重构

行业投资评级 - 看好：预期未来6个月内行业指数优于市场指数5%以上 [5] 报告核心观点 - DeepSeek在2026年4-5月将V4-Pro API价格永久降至原价的1/4，统一降价75%，成为国产大模型价格战的关键转折点，改写了全球大模型API定价基准 [1][2][9] - 降价源于底层技术架构优化，V4系列采用混合注意力架构与多token预测技术，单token推理浮点运算量仅为前代V3的27%，KV缓存大小降至前代的10%，工程效率实现突破 [2][14] - 降价未牺牲模型能力，Openrouter数据显示2026年5月至今DeepSeek V4 Flash调用量排名第一 [2][13] - 降价将刺激大模型总调用量爆发式增长，推动产业链系统性价值重分配，AI应用从试点阶段进入全面商业化兑现期 [3][22][23] - 国产算力生态成熟提供供应链支撑，DeepSeek V4已与华为昇腾完成深度适配，为国产半导体产业链打开替代窗口 [2][15][22] 根据目录总结一、从阶段性补贴到长期价格锚的确立 - 2026年4-5月，DeepSeek将V4-Pro API价格永久降至原定价的1/4，各计费项统一降价75% [9][10][11] - 降价后，DeepSeek V4-Pro标准输入价格（3元/百万Tokens）仅为GPT-5.5 Pro标准输入价格（216元/百万Tokens）的约1/72，在高缓存命中场景下企业使用成本可下降90%以上 [2][12] - 小米随后跟进MiMo-V2.5系列API永久降价，最高降幅达99%，进一步巩固了普惠大模型的价格锚 [1][12][13] - 行业的估值逻辑正从“模型稀缺性叙事”向“成本效率+真实ROI”切换 [9] 二、工程效率突破而非短期补贴 - DeepSeek V4系列引入压缩稀疏注意力与重度压缩注意力结合的混合架构，并采用多token预测技术 [14] - V4-Pro单token推理浮点运算量仅为前代V3的27%，KV缓存大小降至前代的10% [2][14] - 在长上下文场景中，随着token位置拉长至1024k，V4-Pro单token计算量仅为0.3 TFLOPs，V4-Flash低至0.12 TFLOPs，而V3.2为1.2 TFLOPs [14] - Gartner预测，到2030年，生成式AI提供商对1万亿参数大语言模型的推理成本将较2025年降低超过90% [2][15] 三、基座模型进入K型分化时代 - DeepSeek永久降价打破了行业原有竞争平衡，基座模型进入K型分化时代 [3][16] - 中间层通用模型厂商面临最大压力，既无闭源前沿模型的能力护城河，又失去了性价比优势 [3][16][19] - 私有化部署能力强的厂商相对受益，金融、政务、能源等行业有刚性本地化需求 [3][19] - C端/多模态产品厂商冲击有限，收入不完全依赖API [3][19] - 闭源前沿模型在复杂任务上仍有护城河，高端模型市场具备独立定价能力，例如智谱GLM-5.1等厂商2026年Q1涨价83%后调用量反而增长400% [3][21] 四、需求扩容与价值重分配 - 降价将大幅刺激大模型总调用量爆发式增长，2026年3月中国大模型日均词元调用量已突破140万亿，三个月内增长超过40% [22] - 云厂商迎来结构性利好，AI推理需求持续增长推高云服务价格中枢，国内头部云厂商AI算力产品价格涨幅普遍在5%至50%之间 [3][22][23] - 国产AI软硬件生态闭环加速形成，为国产半导体产业链打开替代窗口 [3][22] - 应用层“Token自由”时代到来，长文档分析、代码生成等场景将实现规模化运行 [3][23] 五、投资建议 - 重点把握三大投资方向：一是优先布局AI应用与Agent赛道；二是布局国产推理算力产业链；三是关注具备强私有化部署能力的行业模型厂商 [4][24] - 需警惕缺乏核心技术壁垒的中间层通用模型厂商风险 [4][25] - 资本市场估值逻辑已转向认可成本曲线重构能力，DeepSeek拟融资700亿元、投前估值450亿美元，资金优先投向AGI前沿研究 [25]