Workflow
思考型工具调用技术
icon
搜索文档
DeepSeek双模型发布:一位是“话少助手” 一位是“偏科天才”
科技日报· 2025-12-08 18:03
公司产品发布与技术突破 - 公司于12月1日同时发布DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个正式版模型 [1] - 在公开推理测试中,V3.2水平达到了OpenAI今年8月推出的GPT-5水平,略低于谷歌的Gemini3 Pro [1] - DeepSeek-V3.2定位为高性价比的日常助手,具备更强的推理能力和智能体能力,旨在成为“数字劳动力”以完成自动生成报表、编写代码等复杂工作 [2] - DeepSeek-V3.2-Speciale专攻高难度数学问题求解、学术研究逻辑验证和编程竞赛解题,旨在将开源模型推理能力推向极致 [2] - 新模型实现了两项质的突破:引用领域专用架构和思考型工具调用技术 [2] - 领域专用架构技术可让模型在完成任务时仅检索最关键信息,从而大幅提升效率、降低消耗 [2] - 思考型工具调用技术使模型在得到指令后,能先思考再调用工具执行,然后根据结果继续思考、再次调用,实现多轮交替的复杂问题解决,并保留记录供后续推理使用 [2] - 这是公司首次将思考融入工具使用,改变了以往模型依赖人“喂”数据的发展范式,实现AI的自我训练和进化 [2] - 公司官方网页端、App和API均已更新为正式版DeepSeek-V3.2,但Speciale版本目前仅以临时API服务形式开放,供社区评测与研究 [4] 行业竞争格局与影响 - 过去一年,以Google、OpenAI等为代表的闭源社区在复杂任务中表现优越,而开源社区受制于架构、资源分配及智能体能力等关键缺陷,与闭源社区性能差距进一步扩大 [3] - 公司发布新模型的根本动力是缩小开源模型与闭源模型间的差距 [4] - 新模型证明了闭源大模型的巅峰并非不可逾越,为我国乃至全球开源大模型的发展注入强心剂 [4] - 公司从今年初发布R1大模型以来,发展主线始终聚焦实用性和泛化能力,让“赶超闭源”从美好愿景变为闭源厂商的现实压力 [4] - 公司为全球开发者提供了一个强大、可控且经济的模型底座,助力大语言模型融入千行百业、形成商业闭环 [4] - 新模型为大语言模型带来了新的治理难题,需警惕工具调用风险,以及学术造假、自动化生成代码漏洞、产业不公平竞争等挑战 [4]