Workflow
DeepSeek “极你太美” bug,官方回应了
猿大侠·2025-08-29 12:12

事件概述 - DeepSeek V3 1模型在代码生成输出中随机出现"极"字 导致编译错误等问题 引发全网热议 [1][2][5] 问题表现 - 输出结果中随机出现"极"字 影响代码编译和结构化输出 [2][11] - 问题波及多个平台 包括火山引擎 chutes 腾讯CodeBuddy和DeepSeek官方 [5] - 腾讯CodeBuddy出现更严重情况 直接插入带"极"字的广告内容 [8] - 国外Reddit平台讨论热烈 关键词包括"extreme" "极"和"極" [7] 临时解决方案 - 通过提示词缓解 禁止特定符号序列模式 [15][19] - 该方法主要针对调用API的第三方平台 DeepSeek V3 1官方不需要此操作 [19] 问题原因分析 - 类似现象在早期R1模型测试中出现过 与模型编程中的"恶性模式"有关 [22] - 模型陷入"thinking"末尾循环时 有千分之一概率输出"极"字后终止思考 [22] - 根本原因可能是数据清洗不彻底 SFT数据合成和预训练数据中存在未清洗的"脏数据" [23] - 模型在RL+阶段将"极"字学习为终止符或语言切换标记 [23] 官方回应 - DeepSeek团队已确认问题 将在最近版本中修复 [12]