行业投资评级 - 看好:预期未来6个月内行业指数优于市场指数5%以上 [5] 报告核心观点 - DeepSeek在2026年4-5月将V4-Pro API价格永久降至原价的1/4,统一降价75%,成为国产大模型价格战的关键转折点,改写了全球大模型API定价基准 [1][2][9] - 降价源于底层技术架构优化,V4系列采用混合注意力架构与多token预测技术,单token推理浮点运算量仅为前代V3的27%,KV缓存大小降至前代的10%,工程效率实现突破 [2][14] - 降价未牺牲模型能力,Openrouter数据显示2026年5月至今DeepSeek V4 Flash调用量排名第一 [2][13] - 降价将刺激大模型总调用量爆发式增长,推动产业链系统性价值重分配,AI应用从试点阶段进入全面商业化兑现期 [3][22][23] - 国产算力生态成熟提供供应链支撑,DeepSeek V4已与华为昇腾完成深度适配,为国产半导体产业链打开替代窗口 [2][15][22] 根据目录总结 一、从阶段性补贴到长期价格锚的确立 - 2026年4-5月,DeepSeek将V4-Pro API价格永久降至原定价的1/4,各计费项统一降价75% [9][10][11] - 降价后,DeepSeek V4-Pro标准输入价格(3元/百万Tokens)仅为GPT-5.5 Pro标准输入价格(216元/百万Tokens)的约1/72,在高缓存命中场景下企业使用成本可下降90%以上 [2][12] - 小米随后跟进MiMo-V2.5系列API永久降价,最高降幅达99%,进一步巩固了普惠大模型的价格锚 [1][12][13] - 行业的估值逻辑正从“模型稀缺性叙事”向“成本效率+真实ROI”切换 [9] 二、工程效率突破而非短期补贴 - DeepSeek V4系列引入压缩稀疏注意力与重度压缩注意力结合的混合架构,并采用多token预测技术 [14] - V4-Pro单token推理浮点运算量仅为前代V3的27%,KV缓存大小降至前代的10% [2][14] - 在长上下文场景中,随着token位置拉长至1024k,V4-Pro单token计算量仅为0.3 TFLOPs,V4-Flash低至0.12 TFLOPs,而V3.2为1.2 TFLOPs [14] - Gartner预测,到2030年,生成式AI提供商对1万亿参数大语言模型的推理成本将较2025年降低超过90% [2][15] 三、基座模型进入K型分化时代 - DeepSeek永久降价打破了行业原有竞争平衡,基座模型进入K型分化时代 [3][16] - 中间层通用模型厂商面临最大压力,既无闭源前沿模型的能力护城河,又失去了性价比优势 [3][16][19] - 私有化部署能力强的厂商相对受益,金融、政务、能源等行业有刚性本地化需求 [3][19] - C端/多模态产品厂商冲击有限,收入不完全依赖API [3][19] - 闭源前沿模型在复杂任务上仍有护城河,高端模型市场具备独立定价能力,例如智谱GLM-5.1等厂商2026年Q1涨价83%后调用量反而增长400% [3][21] 四、需求扩容与价值重分配 - 降价将大幅刺激大模型总调用量爆发式增长,2026年3月中国大模型日均词元调用量已突破140万亿,三个月内增长超过40% [22] - 云厂商迎来结构性利好,AI推理需求持续增长推高云服务价格中枢,国内头部云厂商AI算力产品价格涨幅普遍在5%至50%之间 [3][22][23] - 国产AI软硬件生态闭环加速形成,为国产半导体产业链打开替代窗口 [3][22] - 应用层“Token自由”时代到来,长文档分析、代码生成等场景将实现规模化运行 [3][23] 五、投资建议 - 重点把握三大投资方向:一是优先布局AI应用与Agent赛道;二是布局国产推理算力产业链;三是关注具备强私有化部署能力的行业模型厂商 [4][24] - 需警惕缺乏核心技术壁垒的中间层通用模型厂商风险 [4][25] - 资本市场估值逻辑已转向认可成本曲线重构能力,DeepSeek拟融资700亿元、投前估值450亿美元,资金优先投向AGI前沿研究 [25]
DeepSeek永久降价:模型成本曲线重构
国新证券·2026-05-29 17:14