国庆前搞大事!DeepSeek 新模型速度翻 3 倍,API 直接半价!网友调侃:这假没法休了
程序员的那些事·2025-09-30 16:45
模型发布与性能 - DeepSeek-V3.2-Exp模型于9月29日作为实验性版本发布,已在Huggingface与魔搭平台开源,官方App、网页端及小程序同步更新[3] - 新模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention(DSA)技术,首次实现细粒度稀疏注意力机制,显著提升长文本训练和推理效率[5] - 与V3.1-Terminus相比,DeepSeek-V3.2-Exp的长文本推理速度提升2-3倍,内存使用量降低30%-40%,训练效率提升约50%[5] 技术性能基准测试 - 在MMLU-Pro通用基准测试中,DeepSeek-V3.2-Exp与V3.1-Terminus得分持平,均为85.0分[6] - 在AIME 2025数学测试中,DeepSeek-V3.2-Exp得分89.3分,比V3.1-Terminus的88.4分提高0.9分[6] - 在Agent工具使用性能测试中,BrowseComp得分从38.5提升至40.1,BrowseComp-zh得分从45.0提升至47.9,显示新模型在特定任务上的优势[6] - Codeforces-Div1编程测试得分从2046分提升至2121分,但部分代码基准如LiveCodeBench从74.9分略降至74.1分[6] 商业策略与定价 - 得益于新模型服务成本大幅降低,DeepSeek官方API价格下调超过50%[7] - 缓存命中时输入价格从0.5元/百万token降至0.2元/百万token,缓存未命中时输入价格从4元/百万token降至2元/百万token[7] - 输出价格从12元/百万token大幅降低至3元/百万token,降幅达75%[7]