计算机行业重大事项点评：DeepSeek: V3.2重塑开源模型性能边界

报告行业投资评级 - 行业评级为“推荐”（维持）[4] 报告核心观点 - DeepSeek-V3.2的综合能力已明显处于开源模型的领先地位，其性能在多项基准测试中媲美或接近顶尖闭源模型，并通过创新的稀疏注意力机制（DSA）实现了效率与性能的双优，成为高性价比的智能体替代方案[7] - DeepSeek-V3.2是首个同步支持思考模式与非思考模式工具调用的模型，在智能体权威评测中达到开源模型最高水准，展现了强大的泛化能力[7] - 报告建议关注由技术进步驱动的AI细分景气方向，包括国产算力、企业级服务及多行业应用场景[7][28] 根据相关目录分别总结一、DeepSeek-V3.2：重塑开源模型性能边界（一）DeepSeek-V3.2：达到顶尖的推理能力 - 2025年12月1日，DeepSeek正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale[2][10] - DeepSeek-V3.2的目标是平衡推理能力与输出长度，适合日常问答和通用Agent任务场景[7][10] - 在公开推理类Benchmark测试中，DeepSeek-V3.2达到了GPT-5的水平，例如AIME 2025数学竞赛得分93.1%（GPT-5为94.6%），仅略低于Gemini-3.0-Pro[7][10] - 相比Kimi-K2-Thinking，V3.2在保持相近性能的同时输出长度大幅降低，显著减少了计算开销与用户等待时间[7][10] （二）DeepSeek-V3.2-Speciale：专攻极限推理，奥赛金牌级性能的研究模型 - DeepSeek-V3.2-Speciale是V3.2的长思考增强版，结合了DeepSeek-Math-V2的定理证明能力，目标是将开源模型的推理能力推向极致[7][13] - 该模型在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro[7][13] - V3.2-Speciale模型成功斩获IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025金牌，其中ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平[7][13] - 在具体评测中，该模型在AIME 2025得分96.0%，在HMMT Feb 2025竞赛得分99.2%[14] - 该模型消耗的Tokens显著更多，成本更高，目前仅供研究使用，不支持工具调用，未针对日常对话与写作任务进行专项优化[13] （三）DeepSeek-V3.2：DSA技术实现效率与性能双优 - 闭源与开源模型性能差距扩大的架构原因包括：对标准注意力机制的过度依赖制约长序列处理效率；开源模型后训练阶段计算投入不足；在AI智能体领域泛化与指令遵循能力存在差距[7][16] - DeepSeek-V3.2通过引入创新的稀疏注意力机制（DSA），将计算复杂度从O(L²)降至O(Lk)，在保持长上下文性能的同时显著提升计算效率[7][17] - DSA采用两阶段训练策略，并支持FP8精度及MLA架构[19] - 实际应用中，在128K长度序列上，推理成本降低数倍，例如预填充成本从每百万token 0.7美元降至0.2美元[19] - 该技术使V3.2在多项基准测试中性能大幅提升，以更低成本缩小了与前沿专有模型的差距[7][19] （四）DeepSeek-V3.2：首个实现思考与工具调用融合的智能体模型 - DeepSeek-V3.2成功克服以往版本在思考模式下无法调用工具的局限，成为DeepSeek推出的首个同步支持思考模式与非思考模式工具调用的模型[7][21] - 这一成就得益于创新的大规模Agent训练数据合成方法，通过构建涵盖1800多种环境与超过8.5万条复杂指令的“难解答、易验证”强化学习任务，系统化提升了模型的推理泛化能力[7][21] - 在智能体权威评测中，DeepSeek-V3.2达到了当前开源模型的最高水准，显著缩小了与闭源模型的技术差距[7][21] - 模型未针对评测工具进行特殊训练，优异表现源于自身强大的泛化性能[7][21] - 在具体工具调用评测中，例如在τ²-Bench ToolUse上得分为80.3，在MCP-Universe上得分为45.9[22] - 在SWE-bench Verified和Terminal Bench2.0的真实世界编码任务中表现卓越，评测分数显著超越其他开源方案[25] - 通过专门的上下文管理策略，成功处理了搜索任务中约20%的超长用例，将得分从基础的51.4大幅提升[25] 二、投资建议 - 建议关注AI细分景气方向[7][27] - 国产算力：关注寒武纪、海光信息、阿里巴巴、中科曙光、景嘉微、龙芯中科等[7][28] - 企业级服务： - 广告：蓝色光标、易点天下[7][28] - 编程：卓易信息、普元信息[7][28] - 决策：海康威视、科大讯飞、第四范式[7][28] - ERP：金蝶国际、用友网络、鼎捷数智[7][28] - 办公：金山办公、合合信息、三六零、福昕软件[7][28] - 应用场景： - 工业：中控技术、索辰科技[7][28] - 军用：中国卫星、中科星图、佳缘科技[7][28] - 医疗：晶泰控股、讯飞医疗科技[7][28] - 财税：税友股份、中科江南、冠中生态[7][28] - 法律：华宇软件、金桥信息[7][28] - 教育：科大讯飞、豆神教育[7][28] - 招聘：同道猎聘、BOSS直聘、北森控股[7][28] - 电力：国网信通、国能日新[7][28] - 驾驶：地平线机器人、禾赛科技、速腾聚创[7][28] - 电商：聚水潭、微盟、光云科技[7][28] - 安全：深信服[7][28]