Workflow
蒸馏攻击
icon
搜索文档
Anthropic一条推文,引发了全球AI圈同仇敌忾的群嘲。
数字生命卡兹克· 2026-02-25 10:38
Anthropic指控中国AI公司进行“蒸馏攻击”事件 - Anthropic指控三家中国AI公司(DeepSeek、Moonshot、MiniMax)对Claude进行了“工业规模的蒸馏攻击”,并称其创建了24000个假账户大规模提取Claude输出,违反了其服务条款[3][13] - 该指控在社交媒体引发广泛群嘲,舆论普遍批评Anthropic存在双重标准,因其自身曾使用盗版数据训练模型[7][8][13] AI模型训练中的“蒸馏”技术 - “蒸馏”是AI行业常见训练技术,指用大模型(教师模型)的输出训练小模型(学生模型),使小模型能以更小体积、更低成本获得部分能力,可类比为“师傅带徒弟”[11][12] - 通过蒸馏训练的模型拥有独立权重,在自身服务器运行,与调用他人API的“套壳”有本质区别[12] - 行业普遍使用蒸馏技术,例如Anthropic从Opus蒸馏出Sonnet,再蒸馏出Haiku[13] Anthropic自身的数据版权诉讼与和解 - 2025年9月,Anthropic就版权诉讼达成历史性和解,支付15亿美元,为美国版权诉讼史上最大和解金额之一[14][17] - 诉讼起因是Anthropic被发现在2021年6月从盗版网站LibGen下载约500万本书,2022年7月从PiLiMi下载约200万本书,总计超700万本有版权书籍用于训练Claude,未获作者同意与报酬[16] - 法官判决指出:使用合法购买书籍训练AI属合理使用;使用盗版书籍训练则构成侵权[16][17] - 2026年1月,音乐出版商对Anthropic提起新诉讼,指控其通过BitTorrent下载超2万首歌曲训练模型,索赔金额高达30亿美元[19] 关于AI时代知识产权与“偷”的哲学讨论 - AI时代的数据“复制”与传统“偷窃”不同,复制不会导致原始数据减少,非零和游戏[25] - 知识产权本质存在争议:一派认为是为激励创新的人为垄断制度;另一派认为创作者应获得回报以维持创作动力[26] - 历史上有类似先例:19世纪美国曾是最大盗版国,不承认外国作品版权;待自身文化产业发展后,转变为知识产权积极捍卫者[27][28] - 新技术(如印刷机、录音机、录像机)诞生时都曾引发对创作者受损的抗议,但最终均找到平衡[31][32][33] - AI的特殊性在于它不仅复制分发内容,还学习创造新内容,触及“人类创造力是否可被复制”的根本问题[35][36] - 人类学习创作过程本身也是对前人知识的“蒸馏”,但被视为基本权利;AI学习则引发是否算“偷”的伦理争议[36][38][40] - 关于AI与版权的争论不应简化为二元对立,涉及法律、伦理、技术等多层面灰色地带[44][45] - 需警惕少数公司以保护版权为名,垄断大模型训练能力,尤其当这些公司集中于某一国家时,对全球其他国家的影响[47][48]
三大国产 AI 遭点名!Anthropic「贼喊捉贼」,马斯克贴脸嘲讽
新浪财经· 2026-02-24 14:23
Anthropic对三家中国AI公司的指控 - Anthropic发布官方文章 指控三家中国AI公司通过“蒸馏攻击”提取其Claude模型能力进行训练[1] - 被点名的公司包括DeepSeek 月之暗面(Kimi)和MiniMax[1] - 指控称这些公司使用了约24000个马甲号 与Claude进行了超过1600万次对话[1] 各公司被指控的具体活动规模与目标 - DeepSeek被指控进行了15万次对话 主要目标是提取推理能力 Anthropic声称通过元数据追溯到了其具体研究人员[3] - 月之暗面被指控进行了340万次对话 瞄准Agent推理 工具使用 编程和计算机视觉 其账号分散在不同渠道 Anthropic称元数据与该公司高管公开资料匹配[3] - MiniMax被指控进行了超过1300万次对话 规模最大 针对Agent编程和工具调用[3] 指控中描述的规避技术手段 - 被指控方通过代理服务绕过访问限制 Anthropic将代理架构称为“九头蛇集群”[5] - 大量账号分散在API和第三方云平台 其中一个代理网络同时管理超过20000个账号[5] - 指控称蒸馏流量与正常客户请求被混合在一起 即通过API代理转发[5] 近期行业类似指控背景 - 在Anthropic指控前11天 OpenAI已指控DeepSeek“搭便车”[3] - 同一天 谷歌威胁情报团队报告称有超过10万条提示词试图复制Gemini的推理能力[3] Anthropic自身的数据获取行为争议 - 2024年初 Anthropic内部启动秘密项目“巴拿马计划”[5] - 内部文件描述为“破坏性地扫描全世界所有的书” 通过购买实体书 液压切割 高速扫描后销毁的方式 六个月内处理了50万到200万本书 花费数千万美元[5] - 内部文件写明“不希望外界知道我们在做这件事”[5] - Anthropic曾使用盗版电子书库训练模型 并于2025年以15亿美元与作者群体达成和解[5] 外界对指控的质疑与反应 - 有观点质疑Anthropic用全世界的数据训练模型未征询同意 却将他人从其API输出中学习称为“蒸馏攻击”[6] - 有疑问指出若指控属实 为何选择公开发文而非诉诸法律[6] - 马斯克评论质疑“他们怎么敢偷Anthropic从人类程序员那里偷来的东西”[7]