报告行业投资评级 - 行业评级为“推荐”(维持)[4] 报告核心观点 - DeepSeek-V3.2的综合能力已明显处于开源模型的领先地位,其性能在多项基准测试中媲美或接近顶尖闭源模型,并通过创新的稀疏注意力机制(DSA)实现了效率与性能的双优,成为高性价比的智能体替代方案[7] - DeepSeek-V3.2是首个同步支持思考模式与非思考模式工具调用的模型,在智能体权威评测中达到开源模型最高水准,展现了强大的泛化能力[7] - 报告建议关注由技术进步驱动的AI细分景气方向,包括国产算力、企业级服务及多行业应用场景[7][28] 根据相关目录分别总结 一、DeepSeek-V3.2:重塑开源模型性能边界 (一)DeepSeek-V3.2:达到顶尖的推理能力 - 2025年12月1日,DeepSeek正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale[2][10] - DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常问答和通用Agent任务场景[7][10] - 在公开推理类Benchmark测试中,DeepSeek-V3.2达到了GPT-5的水平,例如AIME 2025数学竞赛得分93.1%(GPT-5为94.6%),仅略低于Gemini-3.0-Pro[7][10] - 相比Kimi-K2-Thinking,V3.2在保持相近性能的同时输出长度大幅降低,显著减少了计算开销与用户等待时间[7][10] (二)DeepSeek-V3.2-Speciale:专攻极限推理,奥赛金牌级性能的研究模型 - DeepSeek-V3.2-Speciale是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,目标是将开源模型的推理能力推向极致[7][13] - 该模型在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro[7][13] - V3.2-Speciale模型成功斩获IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025金牌,其中ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平[7][13] - 在具体评测中,该模型在AIME 2025得分96.0%,在HMMT Feb 2025竞赛得分99.2%[14] - 该模型消耗的Tokens显著更多,成本更高,目前仅供研究使用,不支持工具调用,未针对日常对话与写作任务进行专项优化[13] (三)DeepSeek-V3.2:DSA技术实现效率与性能双优 - 闭源与开源模型性能差距扩大的架构原因包括:对标准注意力机制的过度依赖制约长序列处理效率;开源模型后训练阶段计算投入不足;在AI智能体领域泛化与指令遵循能力存在差距[7][16] - DeepSeek-V3.2通过引入创新的稀疏注意力机制(DSA),将计算复杂度从O(L²)降至O(Lk),在保持长上下文性能的同时显著提升计算效率[7][17] - DSA采用两阶段训练策略,并支持FP8精度及MLA架构[19] - 实际应用中,在128K长度序列上,推理成本降低数倍,例如预填充成本从每百万token 0.7美元降至0.2美元[19] - 该技术使V3.2在多项基准测试中性能大幅提升,以更低成本缩小了与前沿专有模型的差距[7][19] (四)DeepSeek-V3.2:首个实现思考与工具调用融合的智能体模型 - DeepSeek-V3.2成功克服以往版本在思考模式下无法调用工具的局限,成为DeepSeek推出的首个同步支持思考模式与非思考模式工具调用的模型[7][21] - 这一成就得益于创新的大规模Agent训练数据合成方法,通过构建涵盖1800多种环境与超过8.5万条复杂指令的“难解答、易验证”强化学习任务,系统化提升了模型的推理泛化能力[7][21] - 在智能体权威评测中,DeepSeek-V3.2达到了当前开源模型的最高水准,显著缩小了与闭源模型的技术差距[7][21] - 模型未针对评测工具进行特殊训练,优异表现源于自身强大的泛化性能[7][21] - 在具体工具调用评测中,例如在τ²-Bench ToolUse上得分为80.3,在MCP-Universe上得分为45.9[22] - 在SWE-bench Verified和Terminal Bench2.0的真实世界编码任务中表现卓越,评测分数显著超越其他开源方案[25] - 通过专门的上下文管理策略,成功处理了搜索任务中约20%的超长用例,将得分从基础的51.4大幅提升[25] 二、投资建议 - 建议关注AI细分景气方向[7][27] - 国产算力:关注寒武纪、海光信息、阿里巴巴、中科曙光、景嘉微、龙芯中科等[7][28] - 企业级服务: - 广告:蓝色光标、易点天下[7][28] - 编程:卓易信息、普元信息[7][28] - 决策:海康威视、科大讯飞、第四范式[7][28] - ERP:金蝶国际、用友网络、鼎捷数智[7][28] - 办公:金山办公、合合信息、三六零、福昕软件[7][28] - 应用场景: - 工业:中控技术、索辰科技[7][28] - 军用:中国卫星、中科星图、佳缘科技[7][28] - 医疗:晶泰控股、讯飞医疗科技[7][28] - 财税:税友股份、中科江南、冠中生态[7][28] - 法律:华宇软件、金桥信息[7][28] - 教育:科大讯飞、豆神教育[7][28] - 招聘:同道猎聘、BOSS直聘、北森控股[7][28] - 电力:国网信通、国能日新[7][28] - 驾驶:地平线机器人、禾赛科技、速腾聚创[7][28] - 电商:聚水潭、微盟、光云科技[7][28] - 安全:深信服[7][28]
计算机行业重大事项点评:DeepSeek: V3.2重塑开源模型性能边界
华创证券·2025-12-15 19:11