Workflow
DeepSeek “极你太美” bug,官方回应了
程序员的那些事·2025-08-28 12:17

事件概述 - DeepSeek V3 1模型在代码生成输出中频繁出现异常"极"字符 导致编译失败等问题 引发全网热议 [1][2][5] - 问题涉及多个平台包括火山引擎 chutes 腾讯CodeBuddy和DeepSeek官方 [5][8] - 海外社区如Reddit也出现大量讨论 主要涉及"extreme" "极" "極"等异常输出 [7][8] 技术表现 - 异常输出形式包括单独"极"字 带"极"字的广告插播 以及"极长"等异常终止符 [8][22] - 问题对需要高精度 结构化输出的代码开发场景造成严重影响 [11] - 部分输出伴随超长响应 大面积空白字符 短句重复等异常模式 [22][23] 根本原因分析 - 现象与早期R1模型出现的"恶性模式"高度相似 模型在无法跳出循环时有概率输出"极"字终止思考 [22] - 根本原因推测为数据清洗不彻底 SFT数据合成和预训练数据中存在未清理的"'极长'数组"脏数据 [23] - 模型在RL+阶段将"极"字学习为终止符或语言切换标记 并通过自蒸馏过程污染正常输出 [23] 临时解决方案 - 通过提示词工程禁止特定符号序列模式可缓解第三方平台问题 [15][19] - 具体方法为禁止"[空格][几个token][占位符/省略符号]"序列输出 [19] - DeepSeek官方平台无需此操作 完全修复需等待版本更新 [12][19][25] 影响范围 - 问题最初在火山引擎 chutes等平台发现 后蔓延至腾讯CodeBuddy等更多平台 [5] - Reddit讨论帖获得高度关注 涉及ID 15075 2577 16411等多个异常输出案例 [7][8] - DeepSeek团队已确认问题并承诺在近期版本中修复 [12]