Seek .(SKLTY)
搜索文档
DeepSeek,上新
中国证券报· 2025-12-01 22:48
模型发布与定位 - 公司于12月1日发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2定位为平衡推理能力与输出长度,适合日常问答和通用Agent任务 [1] - DeepSeek-V3.2-Speciale是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,旨在将开源模型的推理能力推向极致 [1] 模型性能表现 - 在公开推理类Benchmark测试中,DeepSeek-V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro [1] - 相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间 [1] - DeepSeek-V3.2-Speciale在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro [2] - V3.2-Speciale在IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025中取得金牌水平成绩,其中ICPC与IOI成绩分别达到人类选手第二名与第十名水平 [2] 基准测试数据对比 - 在AIME 2025测试中,V3.2得分为93.1(16k),V3.2-Speciale得分为96.0(23k),优于GPT-5的94.6(13k)和Gemini-3.0-Pro的95.0(15k) [3] - 在HMMT Feb 2025测试中,V3.2-Speciale以99.2(27k)的得分显著领先于GPT-5的88.3(16k)和Gemini-3.0-Pro的97.5(16k) [3] - 在CodeForces测试中,V3.2-Speciale得分为2701(77k),接近Gemini-3.0-Pro的2708(22k),远超V3.2的2386(42k) [3] - 在高度复杂任务上,Speciale模型大幅优于标准版本,但消耗的Tokens也显著更多,成本更高 [3] 技术特性与创新 - DeepSeek-V3.2是公司推出的首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用 [4] - 公司通过提出一种大规模Agent训练数据合成方法,构造大量难解答、易验证的强化学习任务,提高模型的泛化能力 [4] - V3.2思考模式增加了对Claude Code的支持,但未充分适配Cline、RooCode等使用非标准工具调用的组件 [4] - DeepSeek-V3.2模型在智能体评测中达到了当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距 [4] 应用与限制 - 目前DeepSeek-V3.2-Speciale仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化 [3] - 公司表示,V3.2并没有针对测试集的工具进行特殊训练,据此认为V3.2在真实应用场景中能够展现出较强的泛化性 [4]
DeepSeek 重要发布
上海证券报· 2025-12-01 21:57
模型发布与产品线更新 - 公司于12月1日同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1] - 官方网页端、App和API均已更新为正式版DeepSeek-V3.2 [1] DeepSeek-V3.2模型定位与能力 - 该模型的目标是平衡推理能力与输出长度,适合日常使用 [1] - 适用场景包括问答场景和通用Agent任务场景 [1] DeepSeek-V3.2-Speciale模型定位与能力 - 该模型的目标是将开源模型的推理能力推向极致,探索模型能力的边界 [1] - V3.2-Speciale是DeepSeek-V3.2的长思考增强版,同时结合了DeepSeek-Math-V2的定理证明能力 [1] - 该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力 [1] - 在主流推理基准测试上的性能表现媲美国际头部模型 [1] DeepSeek-V3.2-Speciale模型竞赛成就 - 该模型成功斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥林匹克)金牌 [1] - 其中,ICPC成绩达到了人类选手第二名的水平 [1] - IOI成绩达到了人类选手第十名的水平 [1]
DeepSeek,又有大动作!
北京日报客户端· 2025-12-01 21:32
DeepSeek模型发布 - 公司同时发布两个正式版模型DeepSeek-V3-2和DeepSeek-V3-2-Speciale [1][2] - DeepSeek-V3-2目标平衡推理能力与输出长度,适合日常问答场景和通用Agent任务场景 [1][2] - DeepSeek-V3-2在公开推理类Benchmark测试中达到GPT-5水平,略低于Gemini-3-0-Pro [2] - 相比Kimi-K2-Thinking,V3-2输出长度大幅降低,显著减少计算开销与用户等待时间 [2] - DeepSeek-V3-2是公司首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用 [1][4] - 公司提出大规模Agent训练数据合成方法,构造1800+环境和85000+复杂指令,大幅提高模型泛化能力 [4] - DeepSeek-V3-2-Speciale是长思考增强版,结合DeepSeek-Math-V2定理证明能力 [3] - Speciale模型在主流推理基准测试上性能表现媲美Gemini-3-0-Pro [3] - V3-2-Speciale模型获得IMO2025、CMO2025、ICPCWorldFinals2025及IOI2025金牌 [3] - Speciale模型在ICPC与IOI成绩分别达到人类选手第二名与第十名水平 [3] - Speciale模型在高度复杂任务上大幅优于标准版本,但消耗Tokens显著更多,成本更高 [3] AI行业市场表现 - 12月1日AI概念表现活跃,AI手机、AI穿戴设备、AIPC、AI算力等方向领涨 [5] - 中兴通讯、鹏鼎控股、天音控股、福蓉科技等纷纷涨停 [5] - AI玩具概念股集体异动,广和通20%涨停,博通集成、实丰文化10%涨停 [5] - 字节跳动豆包团队发布豆包手机助手技术预览版,与手机厂商在操作系统层面合作 [5][6] - 华为首款AI情绪陪伴产品“智能憨憨”开售即卖断货,定价399元 [6] 行业机构观点 - 全球AI产业已进入共振期,AI基建加速扩张与下游应用商业化落地同步推进 [1][6] - 华龙证券认为AI产业有望持续繁荣,建议关注国产芯片、国产服务器、AI应用等方向 [6] - 信达证券表示计算机板块营收规模的“扩容天花板”持续上移,为PS估值提供强支撑 [6] - 中金公司展望2026年认为AI基建与应用仍是主线 [7] - 中金建议关注国产AI链加速创新、海外AI硬件高景气、国内端侧AI产业创新落地等投资机会 [7]
DeepSeek又上新!模型硬刚谷歌,承认开源与闭源差距拉大
第一财经· 2025-12-01 21:31
模型发布与核心定位 - 公司于12月1日晚发布两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale,其推理能力全球领先 [1] - DeepSeek-V3.2定位为平衡推理能力与输出长度,适合日常问答和通用智能体任务场景,此次为9月底实验版V3.2-Exp的正式版更新 [3] - DeepSeek-V3.2-Speciale定位为将开源模型推理能力推向极致的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,具备出色的指令跟随和逻辑验证能力 [3] 模型性能表现 - 在公开推理测试中,DeepSeek-V3.2达到GPT-5水平,仅略低于谷歌Gemini3 Pro [3] - DeepSeek-V3.2-Speciale在多个推理基准测试中超越谷歌Gemini3 Pro,特别是在数学竞赛中表现优异 [4] - 具体测试成绩显示:在美国数学邀请赛(AIME 2025)中,Gemini3 Pro得分为95.0(15k),DeepSeek-V3.2得分为93.1(1k);在哈佛MIT数学竞赛(HMMT Feb 2025)中,Gemini3 Pro得分为97.5(16k),DeepSeek-V3.2-Speciale得分为92.5(1k) [5] - Speciale模型斩获IMO、ICPC World Finals及IOI金牌,其中ICPC与IOI成绩分别达到人类选手第二名与第十名水平 [5] 技术突破与优化 - 两款模型均引入稀疏注意力机制(DSA),旨在解决标准注意力机制对长序列处理效率的制约,并确认该机制可大幅降低计算复杂度且不牺牲长上下文性能 [7] - 采用新机制后,V3.2在智能体场景中成为具有成本效益的替代方案,不仅缩小了与前沿专有模型的性能差距,成本也显著降低 [8] 行业趋势与挑战 - 当前开源与闭源模型的差距在拉大,闭源专有模型(如谷歌、OpenAI、Anthropic)的性能增长速度显著更快 [6] - 闭源模型与开源模型之间的性能差距并未缩小反而日益扩大,专有系统在复杂任务中展现出越来越强的优势 [6] - 开源模型面临三大关键缺陷:标准注意力架构制约长序列处理效率、后训练阶段计算投入不足、AI智能体泛化能力和指令遵循能力存在差距 [7] 产品部署与市场反响 - 公司官方网页端、App和API均已更新为正式版DeepSeek-V3.2,但Speciale版本目前仅以临时API服务形式开放,供社区评测与研究 [8] - 海外社媒有观点认为此次发布是了不起的成就,匹配GPT-5和Gemini3 Pro的开源模型出现,差距正式消除,证明严谨工程设计可超越单纯参数规模 [8]
AI进化速递 | DeepSeek发布新模型
第一财经· 2025-12-01 20:48
大模型技术迭代与产品发布 - DeepSeek V3.2正式版发布,核心升级在于强化Agent能力并融入思考推理[1] - 豆包手机助手发布技术预览版[1] 自动驾驶商业化进展 - 滴滴自动驾驶在广州试运行全天候、全无人Robotaxi服务[1][2] 产学研合作与战略联盟 - 清华大学成立具身智能与机器人研究院[1] - 汇丰银行与Mistral AI达成战略合作,旨在增进银行业务中生成式AI的应用[1][2]
DeepSeek V3.2 正式版发布:性能比肩GPT-5 ,略低于 Gemini-3.0-Pro
新浪科技· 2025-12-01 19:23
模型发布与产品更新 - 公司于12月1日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale [1] - 官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2,供广大用户使用 [1] - DeepSeek-V3.2-Speciale 版本目前仅以临时 API 服务形式开放,主要供社区评测与研究 [1] DeepSeek-V3.2 模型性能与定位 - DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景 [1] - 在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro [1] - 相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间 [1] DeepSeek-V3.2-Speciale 模型性能与定位 - DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界 [2] - V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力 [2] - 该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能媲美 Gemini-3.0-Pro [2] DeepSeek-V3.2-Speciale 模型成就 - V3.2-Speciale 模型斩获 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及 IOI 2025(国际信息学奥林匹克)金牌 [2] - 其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平 [2] DeepSeek-V3.2-Speciale 模型特点与限制 - 在高度复杂任务上,Speciale 模型大幅优于标准版本,但消耗的 Tokens 也显著更多,成本更高 [2] - 目前,DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化 [2]
DeepSeek发布两个正式版模型
证券时报网· 2025-12-01 19:18
模型发布与产品更新 - DeepSeek于12月1日发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1] - 官方网页端、App和API均已更新为正式版DeepSeek-V3.2 [1] - DeepSeek-V3.2-Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究 [1] 模型定位与目标 - DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent任务场景 [1] - DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致,探索模型能力的边界 [1]
DeepSeekV3.2正式版发布 强化Agent能力 融入思考推理
华尔街见闻· 2025-12-01 19:11
模型发布策略 - 公司同时发布两个正式版模型DeepSeek-V3 2和DeepSeek-V3 2-Speciale [1] - DeepSeek-V3 2模型目标为平衡推理能力与输出长度 适合日常问答和通用Agent任务场景 [1] - DeepSeek-V3 2-Speciale模型目标为将开源模型推理能力推向极致 探索模型能力边界 [1]
AI周报 | DeepSeek开源奥数金牌水平模型;前OpenAI 联创称规模扩展时代已终结
第一财经· 2025-11-30 08:48
DeepSeek模型进展 - 开源首个达到国际奥林匹克数学竞赛金牌水平的数学模型DeepSeek-Math-V2 [1] - 模型部分性能优于谷歌旗下的Gemini DeepThink [1] - 行业头部厂商近期密集迭代模型,包括OpenAI发布GPT-5.1、xAI发布Grok 4.1、谷歌发布Gemini 3系列 [1] AI技术路线与行业观点 - 前OpenAI联合创始人伊利亚·苏茨克维认为AI规模扩展时代已终结,主流路线遇到瓶颈 [2] - 其观点指出算力规模已很大却不能持续带来更好的扩展,扩展与浪费算力界限模糊 [2] - 未来需要解决大模型泛化能力比人类差的问题,AI可能缺少人类情绪这种价值函数 [2] 百度组织架构调整 - 百度新设立基础模型研发部与应用模型研发部两大部门 [3] - 基础模型研发部由吴甜牵头专注通用人工智能大模型研发,应用模型研发部由贾磊负责聚焦业务场景专精模型调优 [3] - 新设部门均直接向百度CEO李彦宏汇报,体现推进干部年轻化决心 [3] 英伟达市场动态与回应 - 英伟达股价一度重挫逾7%,市值瞬间蒸发近3500亿美元,最终收跌2.59% [4] - 公司回应大空头迈克尔·伯里言论,称战略投资在营收中比例较小,投资组合公司主要从第三方客户获取收入 [4] - 投资者对AI算力真实需求和投入能否转化为足够收益产生怀疑 [4] 谷歌硬件与芯片动态 - 谷歌重启AI眼镜项目,硬件代工由富士康负责,参考设计由三星提供,芯片由高通提供 [5][6] - 项目已进入小批量试产阶段,预计最早2026年第四季度发布 [6] - 谷歌自研第七代TPU单芯片峰值算力可达4614TFLOPs,是目前性能最强大、能效最高的自研芯片 [10] AI产业链公司动态 - 工业富联澄清第四季度业绩目标下调传闻,称英伟达GB200、GB300等相关产品出货均按计划推进 [8] - 公司股价从10月30日到11月24日累计下跌30.77%,但11月25日至28日累计上涨8.54% [8] - 天孚通信辟谣获谷歌30亿美元订单,称信息不实 [9] AI行业资源消耗与挑战 - 汇丰银行分析指出OpenAI至2030年仍难盈利,即便用户规模覆盖全球成年人44%且营收可能突破2130亿美元 [7] - OpenAI目标在本年代末达到36GW算力,接近美国中型州用电量,预计自由现金流仍为负,整体缺口达2070亿美元 [7] - 摩根士丹利报告指出AI不仅是主要电力消费者,也是吃水大户,数据中心严重依赖水资源 [11][12]
大摩中国CIO调查:B端对千问和阿里云兴趣显著增加,预计三年内千问超越DeepSeek
华尔街见闻· 2025-11-29 10:06
中国企业级AI市场结构性变局 - 企业客户在生成式AI的部署上正迅速从独立模型开发商转向拥有全栈能力的超大规模云厂商 [1] - 企业客户在深水区更看重算力基础设施与模型的深度整合而非单一的模型算法优势 [2] - 40%的CIO计划在未来12个月内通过公有云部署GenAI远高于半年前的28% [3] 阿里巴巴的竞争优势与市场地位 - 阿里巴巴凭借“云基座+通义千问”的组合被确立为“中国最佳AI赋能者”其在B端的吸引力正快速逼近并有望在三年内超越DeepSeek [1] - 阿里云在2025年上半年占据35.8%的市场份额超过了第2至第4名竞争对手的总和 [8] - 通义千问的意向度从上半年的18%激增至30%增长势头最为迅猛而DeepSeek的兴趣度大幅下降20个百分点至45% [6] 阿里巴巴未来增长预期 - 预计阿里云营收增速将在2026财年下半年加速至35%以上并在2027财年进一步冲高至40% [9] - 管理层透露Token使用量每2-3个月翻一番三年3800亿元人民币的资本开支可能仍不足以满足当前指数级的需求 [9] - 大摩推演三年内阿里巴巴/通义千问有望以37%的份额占据榜首超越DeepSeek(28%)、华为(13%)和字节跳动(12%) [6]