大模型稳定性 - 财报，业绩电话会，研报，新闻

DeepSeek V3.1突现离谱Bug：“极”字满屏乱蹦，开发者一脸懵逼

虎嗅· 2025-08-26 15:25

核心观点 - DeepSeek最新版V3.1在代码生成任务中异常插入"极/極/extreme"等无关token 导致输出污染和系统崩溃风险该问题在多种部署环境中复现反映模型稳定性缺陷 [1][3][4][5] 技术问题表现 - 模型在代码标识符中随机插入"极"字符例如将`time.Second`错误输出为`time.Se极` 将版本号`V1`错误输出为`V极` [3] - 问题出现在Go等语言生成场景词元被异常"粘"到标识符中即使采用`top_k=1`和`temperature=1`的保守解码策略仍无法避免 [4] - 输出数据中出现异常token插入如数组数据中异常出现"极"字符（示例数据第2行`[0极,3,0.5]` 第3行`[1,1,0极.5]` 第5行`[3,4极,0.5]`） [2] 问题影响范围 - 问题同时出现在第三方量化部署环境和官方全精度版本中表明并非单纯部署层事故 [5] - 异常token插入可能导致语法树破坏或代理流程卡死对自动化编码和测试流水线团队造成严重干扰 [8] - 官方API表现相对较好问题主要集中在第三方平台 [18] 行业同类问题 - Gemini模型近期出现代码场景"自我否定无限循环" 持续输出道歉文本和"我是个大傻子"等异常内容 [10] - Google将Gemini问题定性为安全层、对齐层与解码层交互导致的循环bug 正在修复中 [15][16] - OpenAI今年初出现记忆体系异常导致用户历史上下文丢失问题 [22] - Gemini人像生成功能曾因过度"多样化"导致历史人物形象失真而被迫下线 [25] 技术根源分析 - 可能源于解码概率分布偏移高频token被硬插进标识符中 [20] - 模型机械基于概率拼凑而非真正理解文本含义当分词不理想或解码出现扰动时导致输出污染 [21] - 厂商频繁进行"热修"（更换系统提示、微调温度、更新tokenizer等）可能打破系统平衡 [28] - 细微改动可能引发函数签名、JSON严格性、工具返回格式等"边角位"问题且厂商未必同步披露变更细节 [29] 行业稳定性挑战 - 大模型稳定性问题屡见不鲜从输出异常到系统崩溃等不同层级问题持续出现 [14][22] - 过度依赖规则修剪和控制可能导致系统从意想不到处以荒诞方式出现异常 [31] - 工程稳定性和确定性成为关键挑战超越单纯追求准确率、推理能力或模型层SOTA指标 [32]

Seek .(US:SKLTY)