Seek .-DeepSeek V3.2发布！实测效果惊艳，便宜是最大优势

产品发布与版本概述 - DeepSeek V3.2版本于12月1日晚正式上线并向所有用户开放，同时在各开源社区上传了本地部署模型供所有用户使用[1] - 该版本共有两个版本：在官方网站免费使用的DeepSeek V3.2版和仅支持API服务访问的DeepSeek V3.2-Speciale版，后者拥有更强的推理能力，主要用于探索模型能力的推理上限[2] - V3.2-Speciale版会主动进入"长思考加强"模式，并结合DeepSeek-Math-V2的定理证明能力，使其拥有更强的指令跟随、数学证明和逻辑验证能力[2] 性能表现与基准测试 - DeepSeek V3.2的推理能力基本与OpenAI的GPT-5相近，但成本远低于GPT-5[1] - V3.2-Speciale在官方测试中的推理基准测试成绩直接媲美最新的Gemini-3.0-Pro[2] - 在IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025等四项赛事决赛试题测试中均获得金牌成绩，在ICPC和IOI测试中达到人类选手第二及第十名水平[4] - 横向对比中，DeepSeek V3.2-Speciale的赛事成绩全部超越了GPT-5 High[4] - 在具体基准测试中，V3.2-Speciale在AIME 2025得分为96.0(23k)，HMMT Feb 2025得分为99.2(27k)，IMOAnswerBench得分为84.5(45k)，LiveCodeBench得分为88.7(27k)，CodeForces得分为2701(77k)[5] 技术创新与成本优势 - 主要技术突破是引入DeepSeek Sparse Attention稀疏注意力机制，通过双版本设计满足不同场景下的推理需求[5] - DSA机制从根本上解决AI大模型在注意力方面的效率问题，通过有选择地计算部分关键元素之间的关联，显著降低所需计算数据[6] - 在DSA机制加持下，128K序列推理成本降低60%以上，推理速度提升约3.5倍，内存占用减少70%，同时模型性能没有明显下降[12] - 在H800集群测试中，序列长度达128K时，预填充阶段每百万token成本从0.7美元降到0.2美元，解码阶段从2.4美元降到0.8美元[12] - DeepSeek V3.2可能成为同级别AI大模型中长文本推理成本最低的模型[12] 功能升级与应用能力 - DeepSeek V3.2允许AI大模型在思考模式下调用工具，调用及使用工具的过程无需训练，使其拥有更强大的通用性能[13] - 作为开源模型可更好兼容使用者自制的工具[13] - 模型具备自主决策使用工具的能力，能够分步骤使用搜索和数学工具解决问题，并进行多轮答案验证[16][19][21] - 新功能使模型可通过拆解问题、逐个提问并针对问题使用不同工具来给出更好的解决方案，最后整合所有回答[21] 行业影响与市场定位 - DeepSeek V3.2在多个权威基准中对标GPT-5、Gemini 3.0 Pro，但推理成本只有行业主流模型三分之一甚至更低[22] - 模型以完全开源方式发布，终结了"开源模型永远落后闭源模型8个月"的行业争论[22] - DSA带来的成本革命对AI大模型商业化造成显著影响，成本下降60%不仅关系运营成本，还包括前期部署成本，使小型企业都可借助DeepSeek训练出更强模型[22] - 长文本交互价格足够低后，高级AI应用将不再局限于企业级市场，能更好推广到消费级市场使用，可能极大加速"AI工具取代传统软件"的趋势[23]