Model Distillation
搜索文档
双倍价格卖你阉割版Mythos!Claude故意降智还不告知、强制留底30天,彻底把用户惹毛
AI前线· 2026-06-10 16:29
文章核心观点 - Anthropic公司发布Claude Fable 5和Mythos 5双模型,实为同一模型(Mythos-class底座)的两种分级销售策略,面向公众的Fable 5版本受到严格的安全机制限制,而近乎无限制的Mythos 5版本仅向白名单机构(如Project Glasswing内的网络安全机构和关键基础设施企业)开放[15][16][17] - 公司在Fable 5模型中部署了用户“不可见”的干预机制,包括修改用户提示词、使用引导向量(steering vectors)或参数高效微调(PEFT)来限制模型在特定前沿研究领域(如AI模型研发、网络安全、生物化学)回答的有效性,且此过程不会主动告知用户[23][25] - 文章质疑模型能力限制的边界已从技术安全考量转向商业竞争考量,通过“防蒸馏”等机制构建“同源不同权”的分层供给特权,模型能力的实际分配正成为与原始能力同等重要的“硬核技术”[39][40] 产品策略与市场定位 - **双模型分级策略**:Claude Fable 5面向公众,Claude Mythos 5仅向“可信访问”名单开放,未来准入计划需与美国政府协商[15][16][17] - **定价差异**:Fable 5的API定价为每百万token输入10美元、输出50美元,是Opus 4.8价格的两倍[18] - **地理限制与计价**:Fable 5提供仅限美国境内推理的版本,输入输出统一按1.1倍计价[19][20] - **数据保留新规**:所有Mythos级流量的数据强制保留30天,此前签有零数据保留协议的客户也不例外[19] 模型性能与安全机制 - **基准测试表现**:在SWE-Bench Pro的Agentic coding测试中,Fable 5得分为80.3%,高于Mythos Preview的77.8%、Opus 4.8的69.2%,并显著领先于GPT5.5的58.6%、Gemini 3.1 Pro的54.2%以及DeepSeek V4-Pro Max的55.4%[2] - **性能标注说明**:官方评测分数取Mythos 5和Fable 5两者中的较高值,带星号项目因安全机制拦截,Fable 5表现更接近Opus 4.8[30][31] - **触发式回退机制**:当用户请求涉及网络安全、生物、化学、医学等“高风险”领域时,模型会通过简单的“关键词匹配”拦截,并自动无缝回退到上一代模型Opus 4.8进行回答,此机制平均触发率官方称不到5%[4][17][18][26] - **移动端敏感度**:在移动端,拦截机制可能更敏感,会删除模型输出的相关信息并替换为更安全的回答[5] 用户影响与信任危机 - **“不可见”的降智**:对于前沿大模型研发类请求,模型通过隐蔽手段限制回答有效性,用户端无任何提示或报错,导致用户无法区分“模型不会”和“模型没尽力”[10][23][27][29] - **信任关系受损**:工程师无法排除“结果不对”是否源于模型被暗中限制,摧毁了用户与工具之间基于输出稳定性的基本信任关系[28][29] - **体验不确定性**:Fable 5的用户体验成为一个概率分布,多数人获得满血性能,少数人触发降级,且用户无法预知自己处于哪个区间[32] 行业趋势与竞争动态 - **从产品到特权**:前沿模型正从“统一能力的产品”转向“分层供给的特权”,能力的边界越来越多由商业规则而非技术极限决定[39][40] - **“防蒸馏”与竞争**:公司将防止模型能力被系统性提取(“蒸馏”)作为安全机制的核心部分,并曾点名指责中国模型公司进行“工业规模的蒸馏攻击”[33][35] - **开源与闭源路线对立**:中国头部模型如Qwen和DeepSeek选择开放权重,而闭源巨头则将“防蒸馏”机制内置,同一行为在不同生态中被赋予截然不同的含义[38] - **“撤梯子”心态**:行业声音批评前沿实验室在自身借助模型能力提升后,通过限制他人访问相同能力来维持竞争优势[15]