ChatGPT爱用破折号是病，奥特曼刚宣布已经治好了

文章核心观点 - OpenAI首席执行官Sam Altman亲自宣布ChatGPT已修复其过度使用破折号的问题 [1][4] - 破折号的滥用已成为AI生成文本的标志性特征，此次修复旨在提升输出内容的自然度 [2][8] - AI写作的特定模式（如过度使用列表、特定句式）被视为可识别的“数字水印” [14][15] ChatGPT的破折号使用问题 - 用户普遍抱怨ChatGPT顽固地在回复中插入破折号和不必要的缩进，即便在自定义指令中明确禁止也无效 [7] - 这种标志性的写作习惯使文本带有明显的“AI味”，极易被识别 [8] - 用户尝试使用戏剧性的情感提示词来纠正此问题，但收效甚微 [9] AI写作的其他标记性特征 - 除破折号外，AI写作的其他怪癖包括过度依赖列表和子标题，以及滥用“不仅是X，也是Y”等特定重复句式 [14] - 这些特征共同构成了可被轻易识别的“数字水印” [15] - 有观点认为对“AI味”的抵制存在过度趋势，但问题根源仍在于模型自身的输出特性 [16][18] 破折号偏好的潜在成因分析 - GitHub工程师Sean Goedecke的研究否定了破折号常见、功能丰富或追求简洁等初步猜想 [21][35] - 研究指出GPT对破折号的偏好并非源自RLHF环节，因为非洲英语中破折号使用频率低于平均水平的十分之一 [24][26] - 关键发现显示破折号使用频率从GPT-4开始比之前增长十倍，问题可能源于3.5到4版本间的训练数据变化 [27][28] - 训练数据荒时期引入的19世纪末至20世纪初的纸质书籍（如1851年《白鲸记》含1728个破折号）可能是破折号使用高峰的根源 [29][30][31]