模型抄袭

搜索文档
华为盘古大模型事件的“三重门”
经济观察网· 2025-07-10 06:55
模型相似性争议 - 开源社区报告指出华为盘古Pro MoE 72B与阿里通义千问Qwen-2 5 14B模型相似度达0 927 远超行业0 7阈值 推测盘古可能基于千问增量训练而非从零训练 [2] - 报告方法遭质疑 行业认为"模型指纹"技术非主流 且HonestAGI团队学术背景未验证 部分引用文献无法查验 报告发布后删除且互动数据远低于同类工具 [4][5][6] - 华为声明盘古Pro MoE为昇腾平台原生训练 仅参考开源代码并标注版权 阿里未回应 [9] 代码版权标识问题 - 盘古开源代码中出现"Copyright 2024 The Qwen team Alibaba Group"标识 引发对模型构建路径的质疑 [8] - 行业专家指出开源社区普遍标注二创模型来源 但"从头训练"表述需严格符合事实 否则损害技术声誉 [8][9] 团队组织变动 - 匿名信称盘古早期由基础语言大模型团队开发 后期由其他团队接手 涉及代码与命名权更迭 并指控存在"洗水印"行为 [10][11] - 匿名信未提供可验证证据 华为未回应 诺亚方舟实验室2025年3月人事调整 王云鹤接任主任 其研究方向为端侧小模型 [11][14] 行业背景与案例 - 大模型版权争议频发 如斯坦福团队被指抄袭面壁智能模型 关键证据为独家数据集使用 最终公开致歉并撤模型 [7] - 行业对"自研"定义未统一 但二次训练模型若宣称"从头训练"将不被接受 [8][9]