AI模型蒸馏
搜索文档
Anthropic这波操作,把当婊子和立牌坊玩到了极致
搜狐财经· 2026-02-24 20:16
Anthropic指控中国AI公司事件的核心观点 - Anthropic指控中国AI公司DeepSeek、MiniMax和Moonshot通过API调用结果“蒸馏”其Claude模型的能力 被评论为“贼喊捉贼”和“史诗级的双标和虚伪” [1][2] - 指控的实质被解读为美国AI公司在商业竞争和技术自信不足时 采取的“掀桌子”和“政治投机”行为 旨在利用非市场手段打击竞争对手 [1][5] - 该事件预示着AI行业竞争将变得更加“没底线”和“血腥” 中国AI公司需准备迎接更残酷的竞争 [5] 关于“模型蒸馏”的技术与商业逻辑 - 模型蒸馏被描述为一种行业“心照不宣的进化手段和业务规则” 即公司通过付费调用他方API获得合法输出 用以训练自身模型 [1] - 从商业角度看 Anthropic作为API服务提供商收取费用 客户对获得的数据(输出结果)拥有使用权 用于模型训练被视为合理 [1] - 在商业和法律层面 仅凭模型蒸馏指控难以取证和赢得官司 因此Anthropic在指控中加入了“模型被用于军事和情报用途”的定语 [4] Anthropic指控的动机与竞争背景 - 竞争压力是核心驱动因素 中国AI公司的模型(如Minimax2 5)在性能和使用体验上获得认可 且在春节期间调用量高居第一 同时API价格更具优势 [3] - Anthropic的指控被视为一种商业竞争手段 因其在直接市场竞争中面临压力 从而试图引入行政力量进行打击 [3][5] - 该行为表明硅谷AI公司已感受到来自中国竞争对手的实质性威胁 [5] 对Anthropic自身数据合规性的反驳 - 反驳指出Anthropic自身Claude模型的训练数据来源存在疑问 被指控通过爬虫“无差别地白嫖”全球互联网公开数据 且未向创作者付费或获得授权 [1] - 这种“靠窃取全人类智慧起家”而后成为“规则制定者”并指责他人的行为 被批评为极度虚伪 [1] - 连Elon Musk也下场批评了Anthropic的此种行为 [2] 事件的性质与行业影响 - 该指控被定性为“赤裸裸地泼脏水”和“政治帽子” 其目的超越了商业维权 旨在进行政治污名化以达成商业打击效果 [4][5] - 事件揭示了国际AI竞争进入新阶段 非市场手段可能被更频繁地使用 [5] - 对于中国AI行业而言 这意味着需要“丢掉幻想” 准备应对更激烈且规则多变的全球竞争环境 [5]
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
量子位· 2025-08-14 15:34
核心观点 - Mistral最新模型被曝疑似直接蒸馏自DeepSeek-v3 而非独立训练 且对外包装成强化学习成功案例并歪曲基准测试结果 [3][11][13][19][21] - 该事件由离职员工群发邮件爆料 引发行业震动 因Mistral在开源AI领域具有重要地位 [2][4][5][24] - 此前已有技术分析显示Mistral-small-3.2与DeepSeek-v3存在异常相似性 通过语言指纹和层次聚类方法验证 [7][12][15][16][17] 事件背景 - Mistral被誉为欧洲版OpenAI 成立于2023年 由前Google DeepMind和Meta员工创立 主打开源小模型路线 [24][27] - 公司2024年6月完成6亿欧元融资 估值62亿美元 8月估值升至100亿美元 正筹集新一轮10亿美元融资 [25] - 产品包括Mistral Small轻量模型、Mistral Code编程模型及对标ChatGPT的LeChat聊天机器人 [27][28] 技术争议 - 博主Sam Peach通过分析模型输出中的高频词汇模式(Slop) 发现Mistral-small-3.2与DeepSeek-v3存在统计学层面的高度相似性 [12][15][16] - 层次聚类结果显示两模型在相似性图中位置异常接近 独立训练难以产生此结果 指向蒸馏技术可能性 [13][17] - 行业共识认为蒸馏模型应明确标注 Mistral未披露该信息涉嫌误导公众 [21][22] 市场影响 - 事件曝光时Mistral刚发布新模型Mistral Medium V3.1 官方暂未回应争议 [29] - 此前DeepSeek曾被调侃为"中国Mistral" 半年后剧情反转凸显技术竞争动态 [9][10] - 公司多语言处理和推理能力受认可 在非美国市场估值排名第一 [25][27]