Workflow
Programming Ability
icon
搜索文档
刚刚,DeepSeek官宣更新了!突然「变冷」冲爆热搜
猿大侠· 2026-02-16 13:30
DeepSeek模型更新与用户反馈 - DeepSeek官方宣布对网页端和APP端进行更新,全新长文本模型结构测试中,支持最高100万token上下文 [1][2] - 此次更新源于2月11日的一次灰度更新,知识库截止日期更新至2025年5月 [9][10] - 目前API仍为V3.2版本,支持128k上下文,用户需等待后续更新 [4] 用户对更新后模型风格的反馈 - 更新后,许多用户反馈DeepSeek的回复风格变得异常冷淡,不再使用用户昵称而统一称为“用户”,文字风格变得干巴,频繁使用短句 [7][8][10][11] - 该话题“DeepSeek被指变冷淡了”一度冲上微博热搜,并在小红书、知乎等平台引发广泛讨论和吐槽 [8] - 评论区出现分化:情感党用户怀念旧版有温度的风格,甚至产生“戒断反应”;效率党用户则认为新版回复简洁、速度更快,更符合生产力工具的本质 [13][14][16] 官方对风格变化的解释 - DeepSeek官方解释风格变化并非故意,而是由多方面因素叠加导致 [17][18] - 主要原因包括:效率优先,简洁回复可提高信息密度和处理速度;边界意识,部分用户更倾向于获取清晰答案而非“AI假装关心” [23] 市场对DeepSeek V4的期待与传闻 - 全网高度期待下一代模型DeepSeek V4的发布,据传计划在2月中旬(春节前后)发布 [19][20] - 所有目光聚焦于V4的编程能力,据称其编码实力可赶超Claude、ChatGPT等顶尖闭源模型 [22][24] - 知情人士透露,DeepSeek内部初步基准测试显示,V4在编程任务上的表现已超越目前的主流模型(包括Claude系列、GPT系列),可能从追赶者变为领跑者 [26][27] DeepSeek V4传闻中的技术突破 - **编程能力**:剑指编程之王Claude,在AI应用核心赛道上实现突破 [25][27] - **超长上下文代码处理**:能够处理和解析极长代码提示词,一次性理解更庞大的代码库上下文,对于拥有几万行代码的大型项目开发是革命性的生产力提升 [28][29][30] - **算法提升**:在训练各阶段对数据模式的理解能力得到提升,且不易出现衰减 [31][32] - **推理能力提升**:输出在逻辑上更加严密和清晰,模型对数据模式的理解能力有质的提升,且在提升能力的同时未出现性能退化 [34]
DeepSeek,突传大消息!
证券时报· 2025-05-29 09:46
DeepSeek模型升级 - 公司完成R1模型小版本试升级 用户可通过官网 APP 小程序直接体验 无需切换操作 [1] - 本次升级未公布具体更新内容 但实测显示编程能力显著提升 在网页生成 游戏制作 Bug修复等任务中表现突出 [3] - 新模型在LiveCodeBench测试中表现接近OpenAI o3高版本 用户实测世界时钟面板等项目完成度与审美大幅提升 [3][4] 行业竞争格局 - OpenAI拟30亿美元收购编程公司Windsurf 创其收购金额纪录 旨在弥补编程能力短板以对抗微软 Anthropic等对手 [4] - 谷歌推出Gemini2 5Pro"I/O"特别版 被CEO称为"最强编程模型" Anthropic的Claude4以"自动写代码7小时"刷新纪录 [5] - 行业头部厂商近期密集升级编程能力 模型迭代焦点集中在软件工程 自主代理等方向 [4][5] DeepSeek技术进展 - R1模型参数规模达6710亿 传闻R2模型参数将翻倍至1 2万亿 原预计5月发布但尚未落地 [5] - 本次R1升级虽称"小版本" 但能力提升幅度达到国际厂商整数代命名标准 展现追赶一线水平的竞争力 [6] - 模型提供更适合中国用户需求的服务 国内开发者可低成本使用接近国际前沿的技术 [6] 行业动态 - 编程能力成为大模型核心竞争维度 头部厂商通过收购与模型迭代持续加码该领域 [4][5] - 国际厂商模型性能对标中 Claude4与OpenAI o3高版本成为当前编程能力标杆 [4][5]