模型技术升级 - 深度求索公司于2月11日对其旗舰模型进行灰度测试,核心升级是将模型上下文窗口从128K Tokens大幅提升至1M Tokens,实现了近8倍的容量增长 [5] - 升级后的1M Tokens窗口意味着模型可以一次性吞吐约75万到90万个英文字母,或处理约8万到15万行代码,并能一次性读入并精准理解约90万字的《三体》三部曲全书内容 [6] - 此次灰度版本的知识库从2024年中期版本更新至2025年5月,但未同步上线视觉理解或多模态输入功能,仍专注于纯文本和语音交互,文件上传处理逻辑为转录文本而非原生多模态理解 [6] 市场竞争定位 - 与GPT-5.1、Gemini 3 Pro、Claude 4.5等大模型相比,DeepSeek依然主打性价比,以约十分之一的价格提供了1M文本上下文处理能力 [6] - 尽管Google的Gemini 3 Pro支持2M以上长文本处理并能同时处理大量视频、音频和文本的复杂媒体任务,但DeepSeek在长文本处理上提供了更具价格竞争力的选择 [6] 用户反馈与产品变化 - 用户发现模型更新后文风大变,被形容为“文绉绉的”,在深度思考模式下常吐出短句,且不再称呼用户设定的昵称而统一称“用户”,导致部分用户感觉失去了此前的共情和理解能力 [7] - 有用户反馈更新后的模型回复带有“爹味”,即习惯说教、居高临下的言行风格,用户尝试更换模型版本或用提示词重新训练均无法调回旧文风 [7] - 不少用户自发号召向官方提意见,希望公司不要为了超长文本能力而舍弃深度思考,也不要为提升数学、代码等理工科能力而降低对文本表达和共情理解能力的支持 [4][8] - 部分用户选择到豌豆荚应用分发平台下载旧版本,或在腾讯元宝里使用DeepSeek,以寻求旧版的交互体验 [4][8] 公司策略与版本信息 - 当用户询问当前模型版本时,DeepSeek明确回答本次灰度版本“不是DeepSeek-V4”且“没有固定的版本号” [9] - 有行业人士认为,此版本类似于极速版,是通过牺牲质量换取速度,是为2026年2月中旬将发布的V4版本做最后的压力测试 [9] - 截至2月12日,深度求索公司并未对此次灰度测试作出公开回应 [10]
DeepSeek变冷淡了
36氪·2026-02-13 18:20