Workflow
AI模型蒸馏
icon
搜索文档
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
量子位· 2025-08-14 15:34
核心观点 - Mistral最新模型被曝疑似直接蒸馏自DeepSeek-v3 而非独立训练 且对外包装成强化学习成功案例并歪曲基准测试结果 [3][11][13][19][21] - 该事件由离职员工群发邮件爆料 引发行业震动 因Mistral在开源AI领域具有重要地位 [2][4][5][24] - 此前已有技术分析显示Mistral-small-3.2与DeepSeek-v3存在异常相似性 通过语言指纹和层次聚类方法验证 [7][12][15][16][17] 事件背景 - Mistral被誉为欧洲版OpenAI 成立于2023年 由前Google DeepMind和Meta员工创立 主打开源小模型路线 [24][27] - 公司2024年6月完成6亿欧元融资 估值62亿美元 8月估值升至100亿美元 正筹集新一轮10亿美元融资 [25] - 产品包括Mistral Small轻量模型、Mistral Code编程模型及对标ChatGPT的LeChat聊天机器人 [27][28] 技术争议 - 博主Sam Peach通过分析模型输出中的高频词汇模式(Slop) 发现Mistral-small-3.2与DeepSeek-v3存在统计学层面的高度相似性 [12][15][16] - 层次聚类结果显示两模型在相似性图中位置异常接近 独立训练难以产生此结果 指向蒸馏技术可能性 [13][17] - 行业共识认为蒸馏模型应明确标注 Mistral未披露该信息涉嫌误导公众 [21][22] 市场影响 - 事件曝光时Mistral刚发布新模型Mistral Medium V3.1 官方暂未回应争议 [29] - 此前DeepSeek曾被调侃为"中国Mistral" 半年后剧情反转凸显技术竞争动态 [9][10] - 公司多语言处理和推理能力受认可 在非美国市场估值排名第一 [25][27]