腾讯CodeBuddy

搜索文档
DeepSeek “极你太美” bug,官方回应了
猿大侠· 2025-08-29 12:12
事件概述 - DeepSeek V3 1模型在代码生成输出中随机出现"极"字 导致编译错误等问题 引发全网热议 [1][2][5] 问题表现 - 输出结果中随机出现"极"字 影响代码编译和结构化输出 [2][11] - 问题波及多个平台 包括火山引擎 chutes 腾讯CodeBuddy和DeepSeek官方 [5] - 腾讯CodeBuddy出现更严重情况 直接插入带"极"字的广告内容 [8] - 国外Reddit平台讨论热烈 关键词包括"extreme" "极"和"極" [7] 临时解决方案 - 通过提示词缓解 禁止特定符号序列模式 [15][19] - 该方法主要针对调用API的第三方平台 DeepSeek V3 1官方不需要此操作 [19] 问题原因分析 - 类似现象在早期R1模型测试中出现过 与模型编程中的"恶性模式"有关 [22] - 模型陷入"thinking"末尾循环时 有千分之一概率输出"极"字后终止思考 [22] - 根本原因可能是数据清洗不彻底 SFT数据合成和预训练数据中存在未清洗的"脏数据" [23] - 模型在RL+阶段将"极"字学习为终止符或语言切换标记 [23] 官方回应 - DeepSeek团队已确认问题 将在最近版本中修复 [12]
DeepSeek “极你太美” bug,官方回应了
程序员的那些事· 2025-08-28 12:17
事件概述 - DeepSeek V3 1模型在代码生成输出中频繁出现异常"极"字符 导致编译失败等问题 引发全网热议 [1][2][5] - 问题涉及多个平台包括火山引擎 chutes 腾讯CodeBuddy和DeepSeek官方 [5][8] - 海外社区如Reddit也出现大量讨论 主要涉及"extreme" "极" "極"等异常输出 [7][8] 技术表现 - 异常输出形式包括单独"极"字 带"极"字的广告插播 以及"极长"等异常终止符 [8][22] - 问题对需要高精度 结构化输出的代码开发场景造成严重影响 [11] - 部分输出伴随超长响应 大面积空白字符 短句重复等异常模式 [22][23] 根本原因分析 - 现象与早期R1模型出现的"恶性模式"高度相似 模型在无法跳出循环时有概率输出"极"字终止思考 [22] - 根本原因推测为数据清洗不彻底 SFT数据合成和预训练数据中存在未清理的"'极长'数组"脏数据 [23] - 模型在RL+阶段将"极"字学习为终止符或语言切换标记 并通过自蒸馏过程污染正常输出 [23] 临时解决方案 - 通过提示词工程禁止特定符号序列模式可缓解第三方平台问题 [15][19] - 具体方法为禁止"[空格][几个token][占位符/省略符号]"序列输出 [19] - DeepSeek官方平台无需此操作 完全修复需等待版本更新 [12][19][25] 影响范围 - 问题最初在火山引擎 chutes等平台发现 后蔓延至腾讯CodeBuddy等更多平台 [5] - Reddit讨论帖获得高度关注 涉及ID 15075 2577 16411等多个异常输出案例 [7][8] - DeepSeek团队已确认问题并承诺在近期版本中修复 [12]