Anthropic声称被Deepseek蒸馏！马斯克为啥怼？

Anthropic指控中国AI公司大规模蒸馏Claude模型事件 - Anthropic发布声明，指控三家中国AI公司DeepSeek、Moonshot AI和MiniMax对其大模型Claude进行大规模“蒸馏” [1][13] - 指控称，三家公司通过超过2.4万个虚假账号，与Claude进行了约1600万次交互，以抽取模型能力训练自家模型 [1][13] - Anthropic形容此行为为系统化、工业级的能力提取，并称之为“hydra cluster”，其请求结构高度重复，集中瞄准推理能力、Agent工具使用、编程与思维链输出等关键能力 [1][13] 被指控公司的具体交互数据与目标 - 具体而言，DeepSeek被指进行了超过15万次交互，侧重抽取推理能力与思维链数据 [3][16] - Moonshot AI被指进行了约340万次交互，聚焦于Agent能力与工具调用 [3][16] - MiniMax被指交互数量最大，约1300万次，集中在Agent编排与工具使用，并被指在新版本发布后迅速切换抽取目标 [3][16] 蒸馏技术的性质与本次争议焦点 - “蒸馏”是AI领域常见的训练方法，利用“教师模型”的输出数据训练“学生模型”，广泛用于模型压缩、轻量化部署及能力迁移，本身并非新技术，也不带有天然的违规属性 [2][14] - 此次争议的焦点在于“方式与规模”，指控称三家公司通过共享支付方式、代理服务和批量化请求结构，系统性抽取Claude的核心能力 [3][16] - Anthropic通过行为识别与异常检测模型发现这一模式，并强调该行为可能削弱模型原有的安全护栏，因此呼吁行业与云服务商采取更严格的防护措施 [3][16] 舆论反应与行业分歧 - 事件引发舆论分歧，Elon Musk在X上抨击Anthropic，讽刺其“你偷来的东西被偷了？”，并提及Anthropic自身曾因训练数据问题饱受争议 [3][7][16][19] - 有行业内部观点认为，争议重点不在蒸馏技术本身，而在具体实施方式，若存在大量虚假账号、批量化请求、绕过服务条款等行为，则可能涉及商业合规与不正当竞争 [9][21] - 另有观点认为，大模型本身建立在互联网公开数据之上，训练数据来源长期存在版权争议，在此背景下以“能力被蒸馏”为由指责竞争对手，立场显得并不牢固 [10][22] 事件揭示的行业规则与法律边界问题 - 从商业角度看，绕过平台规则、大规模抽取核心能力的行为容易引发争议；但从技术实践看，模型输出是否具备明确、可独占的产权属性，目前缺乏清晰的法律标准 [11][23] - 包括OpenAI在内的多家头部企业也曾在不同场景采用蒸馏技术，但内部蒸馏与基于竞品输出训练模型之间的边界，目前仍缺乏统一标准 [11][23] - 问题的核心在于规则如何界定：什么属于合理使用，什么构成系统性能力抽取，巨头之间互相蒸馏的边界有待进一步厘清 [12][24]