Anthropic声称被Deepseek蒸馏!马斯克为啥怼?
新浪财经·2026-02-24 15:57

Anthropic指控中国AI公司大规模蒸馏Claude模型事件 - Anthropic发布声明,指控三家中国AI公司DeepSeek、Moonshot AI和MiniMax对其大模型Claude进行大规模“蒸馏” [1][13] - 指控称,三家公司通过超过2.4万个虚假账号,与Claude进行了约1600万次交互,以抽取模型能力训练自家模型 [1][13] - Anthropic形容此行为为系统化、工业级的能力提取,并称之为“hydra cluster”,其请求结构高度重复,集中瞄准推理能力、Agent工具使用、编程与思维链输出等关键能力 [1][13] 被指控公司的具体交互数据与目标 - 具体而言,DeepSeek被指进行了超过15万次交互,侧重抽取推理能力与思维链数据 [3][16] - Moonshot AI被指进行了约340万次交互,聚焦于Agent能力与工具调用 [3][16] - MiniMax被指交互数量最大,约1300万次,集中在Agent编排与工具使用,并被指在新版本发布后迅速切换抽取目标 [3][16] 蒸馏技术的性质与本次争议焦点 - “蒸馏”是AI领域常见的训练方法,利用“教师模型”的输出数据训练“学生模型”,广泛用于模型压缩、轻量化部署及能力迁移,本身并非新技术,也不带有天然的违规属性 [2][14] - 此次争议的焦点在于“方式与规模”,指控称三家公司通过共享支付方式、代理服务和批量化请求结构,系统性抽取Claude的核心能力 [3][16] - Anthropic通过行为识别与异常检测模型发现这一模式,并强调该行为可能削弱模型原有的安全护栏,因此呼吁行业与云服务商采取更严格的防护措施 [3][16] 舆论反应与行业分歧 - 事件引发舆论分歧,Elon Musk在X上抨击Anthropic,讽刺其“你偷来的东西被偷了?”,并提及Anthropic自身曾因训练数据问题饱受争议 [3][7][16][19] - 有行业内部观点认为,争议重点不在蒸馏技术本身,而在具体实施方式,若存在大量虚假账号、批量化请求、绕过服务条款等行为,则可能涉及商业合规与不正当竞争 [9][21] - 另有观点认为,大模型本身建立在互联网公开数据之上,训练数据来源长期存在版权争议,在此背景下以“能力被蒸馏”为由指责竞争对手,立场显得并不牢固 [10][22] 事件揭示的行业规则与法律边界问题 - 从商业角度看,绕过平台规则、大规模抽取核心能力的行为容易引发争议;但从技术实践看,模型输出是否具备明确、可独占的产权属性,目前缺乏清晰的法律标准 [11][23] - 包括OpenAI在内的多家头部企业也曾在不同场景采用蒸馏技术,但内部蒸馏与基于竞品输出训练模型之间的边界,目前仍缺乏统一标准 [11][23] - 问题的核心在于规则如何界定:什么属于合理使用,什么构成系统性能力抽取,巨头之间互相蒸馏的边界有待进一步厘清 [12][24]