Seek .(SKLTY)
搜索文档
A股盘前播报 | DeepSeek发布两款新模型 新版本强化Agent能力
智通财经网· 2025-12-02 08:38
盘前要闻 2、深夜白银迭创新高!年内涨幅已经突破100%,黄金也突破近6周高点 类型:市场 情绪影响:正面 1、DeepSeek发布V3.2系列模型,强化Agent能力,推理能力追平GPT-5 类型:行业 情绪影响:正面 DeepSeek发布V3.2系列两款模型并开源。V3.2主打日常应用,推理能力达GPT-5水平,首次实现思考模 式与工具调用融合。V3.2-Speciale专注极致推理,在IMO、CMO、ICPC、IOI四项国际竞赛中斩获金 牌。 现货白银再度突破历史新高至58.8美元/盎司,今年涨幅已翻倍,背后推手包括供应紧张、投机逼空与 宏观事件驱动等,这一轮白银涨势已经显现投机逼空的态势。与此同时,现货黄金最高摸到每盎司4264 美元,也是10月中旬创历史高位之后的六周新高。 3、11月新势力销量出炉!零跑7万辆夺冠,小米超4万辆,蔚来大增76.3% 类型:行业 情绪影响:正面 多家新能源汽车品牌公布了11月的最新成绩单。零跑汽车当月交付量达到70327辆,同比增长超75%; 紧随其后的小米汽车,11月交付量再超4万辆;小鹏汽车交付新车36728辆,同比增长19%;蔚来公司在 11月交付新车36275 ...
ChatGPT 三周年遭 DeepSeek 暴击,23 页技术报告藏着开源登顶的全部秘密
36氪· 2025-12-02 08:16
慢、笨、呆?DeepSeek V3.2 上新黑科技 过去几个月,AI 圈出现了一个明显的趋势:闭源模型越跑越快,开源模型却有点跟不上节奏了。DeepSeek 团队分析后发现,开源模型在处理复杂任务时 有三个核心瓶颈:架构问题、资源分配以及智能体能力。 针对这三个问题,DeepSeek 这次拿出了三个大招。 ChatGPT 诞生三周年之际,DeepSeek 送上「庆生礼物」。 就在刚刚,DeepSeek 一口气发布两款模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。这两个模型不仅在推理能力上直逼 GPT-5 和 Gemini-3.0-Pro,更 重要的是,它们解决了一个困扰开源模型很久的问题: 怎么让 AI 既会深度思考,又会熟练使用工具? 新模型省流版如下 两个模型的权重都已经在 HuggingFace 和 ModelScope 上开源,你可以下载到本地部署。 如果你用过一些 AI 模型处理超长文档,可能会发现速度越来越慢,甚至直接卡死。这就是传统注意力机制的锅。 传统注意力机制的逻辑是:每个字都要和之前所有的字计算相关性。文档越长,计算量就越大。就像你在一个有 1000 ...
DeepSeek更新线上模型,大幅缩小与闭源模型差距
选股宝· 2025-12-02 07:20
12月1日,DeepSeek宣布推出DeepSeek V3.2正式版:强化Agent能力,融入思考推理。在智能体评测中 达到了当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。 公司表示,其中的V3.2-Speciale模型版本成功斩获 IMO 2025(国际数学奥林匹克)、CMO 2025(中国 数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信 息学奥林匹克)金牌。 点评:华西证券表示,伴随阿里QWEN大模型等同类竞品处于快速迭代状态,国内包括豆包大模型、 Deepseek后续同样有望实现迭代速,AI产业整体景气度有望继续提升。同时东吴证券认为,从科技浪潮 演进角度,终局看AI赋能万物一定是通过应用端实现,亦即应用端的爆发具有中期确定性,且空间较 上游硬件更为广阔,这一点已经在10年前的"互联网+"浪潮以及对应的股市行情中得到验证,这也意味 着AI应用的行情启动只是时间问题。 另外东吴证券还指出,拥有AI全栈布局能力的大厂自研算力方案,与英伟达GPUNVL算力方案,在不 同的应用场景中各有优势,而且在当前AI宏伟叙事下,产业 ...
DeepSeek又上新!模型硬刚谷歌 承认开源与闭源差距拉大
第一财经· 2025-12-02 07:13
【相关阅读】 开源最强!拳打GPT 5,脚踢Gemini-3.0,DeepSeek V3.2为何提升这么多? 梁文锋署名论文,DeepSeek最强开源Agent模型炸场 DeepSeek发布最强开源新品,瞄向全能Agent,给GPT-5与Gemini 3下战书 来源:第一财经 12月1日晚,DeepSeek又上新了两款新模型,DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在推理能力上全球领先。 两款模型有着不同的定位。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。9月底DeepSeek发布了 实验版V3.2-Exp,此次是正式版更新。在公开推理测试中,V3.2达到了GPT-5的水平,仅略低于谷歌的Gemini3 Pro。 DeepSeek-V3.2-Speciale则是此次的重头戏,其目标是"将开源模型的推理能力推向极致,探索模型能力的边界"。据介绍,Speciale是V3.2的长思考增强版, 同时结合了DeepSeek-Math-V2的定理证明能力,该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力。 据DeepSe ...
DeepSeek 重大发布
证券时报· 2025-12-01 23:04
DeepSeek最新动作。 12月1日晚间,DeepSeek发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 据悉,DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用。在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅 略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间。 DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界,是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek- Math-V2 的定理证明能力。 据DeepSeek透露,DeepSeek-V3.2-Speciale 在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。同时,V3.2-Speciale 模型成功斩获 IMO 2025(国际数 学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生 ...
DeepSeek 上新
中国证券报· 2025-12-01 23:04
12月1日,DeepSeek微信公众号宣布,今日发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。 DeepSeek-V3.2与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗Tokens总量约数) 图片来源:DeepSeek微信公众号 从数据来看,在高度复杂任务上,Speciale模型大幅优于标准版本,但消耗的Tokens也显著更多,成本更高。DeepSeek表示,目前DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。 在使用上,不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2是DeepSeek推出的首个将思考融入工具使用的模型,并且同时支持思考模 式与非思考模式的工具调用。公司通过提出一种大规模Agent训练数据合成方法,构造大量难解答、易验证的强化学习任务,提高模型的泛化能力。 公司表示,DeepSeek-V3.2思考模式增加了对Claude Code的支持,但未充分适配Cline、RooCode等使用非标准工具调用的组件,因此建议用户在使用此类 组件时继续 ...
DeepSeek发布最强开源新品,瞄向全能Agent,给GPT-5与Gemini 3下战书
钛媒体APP· 2025-12-01 23:03
图片来源:unsplash ChatGPT迎来三周岁生日之际,竞争对手DeepSeek送来了一份"生日礼",似乎并不想让这位大模型领域 的先行者过得那么轻松。 12月1日晚间,DeepSeek一口气发布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个正式版模型,同步发 布的技术论文显示,这两个推理能力达到了全球领先水平。 根据DeepSeek介绍,已经在网页端、App、API全部更新的"常规军"V3.2重在平衡推理能力与输出长 度,适合日常使用。 在Benchmark推理测试中,V3.2与GPT5、Claude 4.5在不同领域各有高低,只有Gemini 3 Pro对比前三者 均有较明显优势。 我们注意到,在大模型测试得分越来越高,但在与普通用户的互动中却经常犯一些常识性错误的当下 (尤其以GPT5发布时遭遇的吐槽为代表),DeepSeek近期"上新"时经常强调这一点,证明自身走的不 是一条只用正确的答案作为奖励机制,打造出了看似高智商的"最强大脑",却无法胜任用户个人所需的 简单任务、简单问题的"低情商"智能体。 而只有从根本上克服这一点,成为所谓高智商、高情商的"双高"大模型 ...
DeepSeek发布V3.2正式版
新京报· 2025-12-01 23:01
新京报贝壳财经讯(记者罗亦丹)12月1日晚间,DeepSeek在官方公号宣布,发布两个正式版模型: DeepSeek-V3.2和DeepSeek-V3.2-Speciale。 其中,DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent任 务场景。在公开的推理类Benchmark测试中,DeepSeek-V3.2达到了 GPT-5的水平,仅略低于Gemini-3.0- Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。 DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致,探索模型能力的边界。V3.2-Speciale 是DeepSeek-V3.2的长思考增强版,同时结合了DeepSeek-Math-V2 的定理证明能力。该模型具备出色的 指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。 ...
DeepSeek,上新
中国证券报· 2025-12-01 22:48
DeepSeek表示,在公开的推理类Benchmark测试中,DeepSeek-V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长 度大幅降低,显著减少了计算开销与用户等待时间。 DeepSeek-V3.2-Speciale模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。V3.2- Speciale模型在IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及 IOI 2025(国际信息学奥林匹克)中取得金牌水平的成绩。其中,ICPC与IOI成绩分别达到人类选手第二名与第十名的水平。 | Benchmark | GPT-5 | Gemini-3.0 | Kimi-K2 | DeepSeek-V3.2 | DeepSeek-V3.2 | | --- | --- | --- | --- | --- | --- | | | High | Pro | Thinking | T ...
DeepSeek 重要发布
上海证券报· 2025-12-01 21:57
DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致,探索模型能力的边界。V3.2-Speciale 是 DeepSeek-V3.2的长思考增强版,同时结合了DeepSeek-Math-V2的定理证明能力。该模型具备出色的 指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美国际头部模型。更 令人瞩目的是,V3.2-Speciale模型成功斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥 林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥 林匹克)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。 (文章来源:上海证券报) 12月1日,DeepSeek同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。据介绍,官方 网页端、App和API均已更新为正式版DeepSeek-V3.2。 DeepSeek称,DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agen ...