降价!DeepSeek,大消息!

模型发布与技术升级 - 公司于9月29日正式发布DeepSeek-V3.2-Exp模型 作为迈向新一代架构的中间步骤[1] - 新模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制 针对长文本训练和推理效率进行探索性优化[1] - DeepSeek Sparse Attention首次实现细粒度稀疏注意力机制 在几乎不影响模型输出效果前提下大幅提升长文本训练和推理效率[3] 模型性能表现 - 公司严格对齐V3.2-Exp与V3.1-Terminus的训练设置进行严谨评估 在各领域公开评测集上表现基本持平[3] - 在多项基准测试中V3.2-Exp表现稳定 MMLU-Pro保持85.0分 GPQA-Diamond从80.7略降至79.9 Codeforces-Div1从2046提升至2121[4] - 新模型在Search Agent任务中表现提升 BrowseComp从38.5提升至40.1 BrowseComp-zh从45.0提升至47.9[4] 商业化与市场策略 - 官方App网页端小程序均已同步更新为DeepSeek-V3.2-Exp 同时API大幅降价[4] - 新价格政策下开发者调用DeepSeek API成本将降低50%以上[4] 近期发展里程碑 - 公司近期动作频繁 9月22日将线上模型升级为DeepSeek-V3.1-Terminus 8月21日正式发布DeepSeek-V3.1[8] - V3.1采用混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强智能体能力[8] - 9月17日DeepSeek-R1推理模型研究论文登上Nature封面 这是中国大模型研究首次登上Nature封面[8] - 该论文首次公开仅靠强化学习就能激发大模型推理能力的重要研究成果 标志着中国AI技术在国际科学界获得最高认可[8] 行业影响与认可 - Nature社论评价几乎所有主流大模型都未经过独立同行评审 这一空白被DeepSeek打破[9] - DeepSeek-R1研究是全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究[8]