Workflow
盘古大模型与通义千问,谁抄袭了谁?
阿尔法工场研究院·2025-07-08 20:22

技术争议核心 - 华为盘古3.5与阿里通义千问1.5-7B模型的"指纹"相关性得分高达0.927,远高于其他主流模型间普遍低于0.1的得分 [14][15][16] - 华为回应称盘古与通义在词表和配置文件存在不同,但技术专家认为这不足以证明底层模型结构和参数不相似 [19][20] - 争议涉及AI开源生态中"复用"与"抄袭"的模糊界限,尤其在Apache 2.0开源协议下如何界定参数相似度的合规性 [28][29] 行业背景与竞争格局 - 大模型研发成本极高,华为单次有效训练成本达1200万美元,行业普遍采用基于优秀开源模型的二次开发模式 [25][26] - 阿里通义系列凭借全尺寸全功能特点在to B市场占据优势,已服务超9万家企业,80%中国科技企业使用阿里云 [27][37] - 华为将盘古模型植入HarmonyOS 4,作为其"软硬芯云"全栈生态的关键环节,尤其在国产昇腾算力上的标杆应用 [32][33] 技术生态现状 - 阿里通义模型家族已推出至少228个模型,覆盖0.5B至72B多种参数规模及文本/图像/语音/视频全模态 [44][45] - Hugging Face榜单显示排名前十的开源模型曾全部基于通义千问二次开发,反映其开源生态影响力 [26] - 行业面临技术发展快于规则制定的矛盾,需建立模型溯源标准、透明化机制以促进健康生态 [52][53][54]