华为盘古否认抄袭阿里后,其大模型员工自曝存在套壳、续训、洗水印
齐鲁晚报·2025-07-07 11:50
华为盘古大模型开源事件 - 华为宣布开源盘古大模型核心组件Pangu Pro MoE 包括70亿参数稠密模型和720亿参数混合专家模型 宣称是构建昇腾生态的关键举措 [1] - 开源仅四天后 GitHub研究指出盘古Pro MoE与阿里通义千问Qwen-2 5 14B模型的注意力参数分布相似性高达0 927 远超业内0 7以下的正常差异范围 [1] 华为官方回应 - 华为诺亚方舟实验室声明盘古Pro MoE是基于昇腾硬件平台开发训练的基础大模型 并非基于其他厂商模型增量训练 [4] - 公司承认部分基础组件代码参考了业界开源实践 但强调严格遵循开源许可证要求并标注版权声明 [4] 内部员工爆料 - 自称盘古大模型团队员工自曝存在套壳续训洗水印现象 初期因算力有限导致效果不佳 领导层默许造假行为换取短期成果 [5] - 爆料称实际使用Qwen 1 5 110B续训而来 通过加层扩增ffn维度等操作凑够135B参数 并采取多种方法洗掉千问水印 [5] - 员工表示还套壳DeepSeekv3续训 通过冻住参数进行训练 最终因技术伦理问题选择离职曝光 [5] 事件后续 - 截至目前华为未对员工自曝内容发表声明 [6]