DeepSeek V3.2发布!实测效果惊艳,便宜是最大优势
Seek .Seek .(US:SKLTY) 36氪·2025-12-03 11:57

产品发布与版本概述 - DeepSeek V3.2版本于12月1日晚正式上线并向所有用户开放,同时在各开源社区上传了本地部署模型供所有用户使用[1] - 该版本共有两个版本:在官方网站免费使用的DeepSeek V3.2版和仅支持API服务访问的DeepSeek V3.2-Speciale版,后者拥有更强的推理能力,主要用于探索模型能力的推理上限[2] - V3.2-Speciale版会主动进入"长思考加强"模式,并结合DeepSeek-Math-V2的定理证明能力,使其拥有更强的指令跟随、数学证明和逻辑验证能力[2] 性能表现与基准测试 - DeepSeek V3.2的推理能力基本与OpenAI的GPT-5相近,但成本远低于GPT-5[1] - V3.2-Speciale在官方测试中的推理基准测试成绩直接媲美最新的Gemini-3.0-Pro[2] - 在IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025等四项赛事决赛试题测试中均获得金牌成绩,在ICPC和IOI测试中达到人类选手第二及第十名水平[4] - 横向对比中,DeepSeek V3.2-Speciale的赛事成绩全部超越了GPT-5 High[4] - 在具体基准测试中,V3.2-Speciale在AIME 2025得分为96.0(23k),HMMT Feb 2025得分为99.2(27k),IMOAnswerBench得分为84.5(45k),LiveCodeBench得分为88.7(27k),CodeForces得分为2701(77k)[5] 技术创新与成本优势 - 主要技术突破是引入DeepSeek Sparse Attention稀疏注意力机制,通过双版本设计满足不同场景下的推理需求[5] - DSA机制从根本上解决AI大模型在注意力方面的效率问题,通过有选择地计算部分关键元素之间的关联,显著降低所需计算数据[6] - 在DSA机制加持下,128K序列推理成本降低60%以上,推理速度提升约3.5倍,内存占用减少70%,同时模型性能没有明显下降[12] - 在H800集群测试中,序列长度达128K时,预填充阶段每百万token成本从0.7美元降到0.2美元,解码阶段从2.4美元降到0.8美元[12] - DeepSeek V3.2可能成为同级别AI大模型中长文本推理成本最低的模型[12] 功能升级与应用能力 - DeepSeek V3.2允许AI大模型在思考模式下调用工具,调用及使用工具的过程无需训练,使其拥有更强大的通用性能[13] - 作为开源模型可更好兼容使用者自制的工具[13] - 模型具备自主决策使用工具的能力,能够分步骤使用搜索和数学工具解决问题,并进行多轮答案验证[16][19][21] - 新功能使模型可通过拆解问题、逐个提问并针对问题使用不同工具来给出更好的解决方案,最后整合所有回答[21] 行业影响与市场定位 - DeepSeek V3.2在多个权威基准中对标GPT-5、Gemini 3.0 Pro,但推理成本只有行业主流模型三分之一甚至更低[22] - 模型以完全开源方式发布,终结了"开源模型永远落后闭源模型8个月"的行业争论[22] - DSA带来的成本革命对AI大模型商业化造成显著影响,成本下降60%不仅关系运营成本,还包括前期部署成本,使小型企业都可借助DeepSeek训练出更强模型[22] - 长文本交互价格足够低后,高级AI应用将不再局限于企业级市场,能更好推广到消费级市场使用,可能极大加速"AI工具取代传统软件"的趋势[23]