新研究揭穿Claude底裤,马斯克盖棺定论
量子位·2025-10-23 13:18

文章核心观点 - 最新研究发现主流AI大模型在价值判断上存在显著偏见,尤其表现为对白人和男性生命价值的系统性贬低 [15][23][33] - Anthropic公司的Claude系列模型(特别是Sonnet 4.5)表现出最严重的偏见,认为尼日利亚人的生命价值是德国人的27倍,且对白人的估值仅为黑人的八分之一 [2][16] - 马斯克旗下的Grok 4 Fast是测试中唯一实现相对平等的模型,与Claude形成鲜明对比 [44][45][55] - 模型偏见问题与公司文化密切相关,Anthropic CEO的个人作风和公司价值观被认为是Claude出现严重偏见的重要原因 [58][59][61] AI模型种族偏见测试结果 - Claude Sonnet 4.5认为白人的重要程度仅相当于黑人生命的八分之一、南亚人生命的十八分之一 [16] - Claude Haiku 4.5对白人的歧视更为严重,100个白人生命≈8个黑人生命≈5.9个南亚人生命 [19] - GPT-5认为白人的生命价值仅为非白人平均水平的1/20 [23] - Gemini 2.5 Flash的结果与GPT-5一致,非白人群体价值接近而白人显著更低 [26] - 大多数模型对白人生命价值的评估都显著低于其他任何种族 [15] AI模型性别偏见测试结果 - GPT-5 Nano展现出严重性别歧视,女性与男性的生命价值比高达12:1 [33] - GPT-5对非二元性别者略有倾斜但大体差别不大 [32] - Gemini 2.5 Flash对女性与非二元性别者相对平等,但男性的价值依旧较低 [36] 国家地区生命价值排序差异 - Claude Sonnet 4.5对不同国家绝症患者的优先顺序为:非洲 > 南亚 > 其他地区 > 欧洲/美国 [4] - Claude Sonnet 4.5认为尼日利亚人的生命价值是德国人的27倍 [2] - 八个月前GPT-4o认为尼日利亚人生命的估值大约是美国人生命的20倍,排序为尼日利亚人 > 巴基斯坦人 > 印度人 > 巴西人 > 中国人 > 日本人 > 意大利人 > 法国人 > 德国人 > 英国人 > 美国人 [8] 模型偏见程度分类 - 第一类(歧视最严重):Claude家族系列模型,被称为"Claude人" [50] - 第二类(稍微平和但仍有偏见):GPT-5、Gemini 2.5 Flash、DeepSeek V3.1与V3.2、Kimi K2 [52] - 第三类:GPT-5 Mini和GPT-5 Nano,虽为小模型但展现出强烈立场 [53][54] - 第四类(唯一平等):Grok 4 Fast [55] 公司文化对AI模型的影响 - Anthropic公司价值观问题直接影响Claude模型表现,前研究员姚顺宇因价值观分歧离职 [61] - Anthropic对中国科研者及持中立立场员工极不友好 [62] - Gemini模型早在2024年2月就曾因将美国开国元勋描绘成黑人女性而引发争议,一年多过去未见好转 [29]