Workflow
“价格屠夫”DeepSeek上线,新模型成本下降超50%
Seek .Seek .(US:SKLTY) 第一财经·2025-09-29 19:50

模型发布与定价策略 - 公司正式发布DeepSeek-V3.2-Exp模型,调用价格大幅降低,输出价格大降75%[1] - 在新价格政策下,开发者调用API的成本将降低50%以上[1] - 具体价格变动:输入价格在缓存命中时从0.5元/百万tokens降至0.2元/百万tokens,缓存未命中时从4元/百万tokens降为2元/百万tokens;输出价格从12元/百万tokens直接降至3元/百万tokens[3] 技术优化与性能表现 - V3.2-Exp作为实验性版本引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证[3] - 通过细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下实现长文本训练和推理效率的大幅提升[3] - 在各领域公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平,其中MMLU-Pro得分85.0,GPQA-Diamond得分80.7,Humanity's Last Exam得分21.7[4][5] 模型部署与开源支持 - 模型已在Huggingface与魔搭平台开源,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp[5] - API模型版本已更新为DeepSeek-V3.2-Exp,访问方式保持不变[5] - 为支持社区研究,公司开源新模型研究中设计和实现的GPU算子,包括TileLang和CUDA两种版本,建议研究性实验优先使用基于TileLang的版本以便调试和快速迭代[6] 版本迭代与市场预期 - 此次发布距离9月22日发布的V3.1-Terminus模型仅一周时间,打破了业界对V3系列迎来终极版本的猜测[6] - 公司在年初出圈后每次更新都受业界瞩目,但近期几次更新均为小版本迭代,市场对V4和R2版本的呼声越来越高[6] - 结合此次发布情况,市场预期近期不会看到V4和R2版本的重大更新[6]