Workflow
AI系统训练
icon
搜索文档
Anthropic指控AI公司蒸馏剽窃,马斯克硬刚“贼喊抓贼”
搜狐财经· 2026-02-25 18:13
核心指控与事件概述 - 美国AI公司Anthropic于2026年2月24日发布声明,指控三家中国头部大模型公司DeepSeek、Moonshot AI和MiniMax通过欺诈性账户和代理服务,大规模窃取其Claude大模型的能力 [3] - 指控的核心技术是“模型蒸馏”,即利用能力较弱的模型在更高级模型(Claude)的输出结果上进行训练,以提升自身模型能力 [3] - Anthropic声称,三家公司通过约24,000个欺诈性账户,生成了超过1,600万次与Claude的交互,目标直指Claude的代理推理、工具使用和编码能力 [3][4] 对各公司的具体指控 - **DeepSeek(深度求索)**:通过超过15万次交互,重点提取Claude在多样化任务中的推理能力,其活动显示出同步流量模式、共享支付方式和协调时间安排,暗示了为增加吞吐量和避免检测而进行的负载均衡 [5] - **Moonshot AI(月之暗面)**:通过超过340万次交互,目标涵盖代理推理、工具使用、编码与数据分析、计算机使用代理开发以及计算机视觉,旨在重建Claude的推理轨迹 [5] - **MiniMax**:这是三者中规模最大的,通过超过1,300万次交互,明确针对代理编码、工具使用和编排,并显示出极强的适应性,曾在24小时内将近一半流量转向新系统以捕获最新功能 [5] 技术分歧与行业背景 - Anthropic指控中国公司利用“九头蛇集群架构”等代理服务绕过前沿AI模型的访问权限 [7] - 行业观点指出,许多基础模型的训练本身基于海量公开互联网数据,通常未获原始作者明确同意,新进入者采用“蒸馏”和优化路线是常见做法 [7][8] - 关于合成数据的所有权及用于训练(尤其是开源模型)的合规性问题,在法律上大多尚未定义,存在根本性分歧 [8] - 此次事件并非首例,此前OpenAI也曾指控DeepSeek蒸馏其GPT模型 [8] 地缘政治与监管考量 - Anthropic从国家安全角度指控模型蒸馏的违法性,认为这可能使美国控制先进AI技术能力输出的努力失效 [9] - 专家指出,当前美国出口管制主要集中在先进半导体和高性能计算基础设施等硬件,以及特定类别的先进AI模型权重,并未禁止向中国提供大型语言模型API访问的通用禁令 [9] - 美国工业和安全局正在持续完善与先进计算商品及高能力系统相关的许可框架,公司若明知其服务支持受限制实体(特别是与军事或战略目标相关的)的训练活动,即使不涉及硬件输出也可能面临风险 [9] - 许多美国AI提供商已通过商业政策和合规行为,主动限制其产品在中国的可用性,范围甚至超出严格规定的要求 [9] 行业影响与应对措施 - 对于使用大语言模型API进行构建或训练的开发者而言,Anthropic的指控凸显了一个日益扩大的灰色地带,服务提供商正密切关注利用模型输出进行大规模自动化训练以开发竞争系统的做法 [10] - Anthropic正在投资防御性技术,包括构建多个分类器和行为指纹系统以识别API流量中的“蒸馏攻击”模式,并加强对教育账户、安全研究项目等易被利用渠道的验证 [11] - Anthropic还计划实施产品级、API级和模型级的防护措施,旨在降低模型输出在非法蒸馏中的有效性,同时不影响合法客户体验 [11] - 行业建议开发者确保模型训练过程安全、合规,应审查API/服务条款,为训练数据来源保留清晰记录及相应许可,并将运营日志与训练数据集分开保存 [11] - 地缘政治尽职调查(如受限方筛查、出口合规审查、地区访问控制)正日益成为AI治理的一部分,开发者需能提供完整的训练流程文档记录 [11]