Workflow
Claude Fable 5
icon
搜索文档
Anthropic“光与影”双重奏:高喊AI风险的同时推顶尖模型
第一财经· 2026-06-10 22:40
新模型发布 - 北京时间2026年6月10日,公司推出Claude Fable 5与仅限特定机构使用的Claude Mythos 5,这对孪生模型共享代号为Capybara的底层架构,标志着公司正式跨越上一代Opus级天花板,实现阶跃式提升[3] - 新模型定价分别为10美元/百万输入Token和50美元/百万输出Token,低于前代Mythos Preview版本[6] - 模型面世过程充满戏剧性,2026年3月26日因内部配置失误导致草案文件全网泄露,公司随后在4月7日推出仅定向开放给网安机构的Mythos Preview[5] 公司发展历程与现状 - 公司成立于2021年2月,创始团队由前OpenAI核心技术与安全成员组成,初始融资规模仅1.24亿美元,估值41亿美元[7] - 成立五年,公司年化收入(ARR)已突破470亿美元,估值达9650亿美元,该年化收入数字在2026年年初时仅为140亿美元[4][8] - 2023年,公司将营收从0做到1亿美元,并预估若2026年保持增速,公司有可能实现盈利[18] 技术能力与优势 - 在Claude 3.5到3.7阶段打下基础,并在Claude 4系列到Mythos模型阶段,在长逻辑推理与系统级安全上形成了显著的局部优势[11] - 信息安全研究员指出,Mythos与Opus之间存在明显代差,Mythos可以超过绝大多数人类专家,并能降低漏洞挖掘门槛,与GPT-5.5这一代模型形成了网络安全能力的分水岭[9] - 公司的优势并非单纯来自模型参数更强,而是来自更早地将Claude模型放入真实工程流程中,通过真实用户、代码库和反馈不断迭代,形成了数据飞轮效应[13][14] - 在Coding(编程)赛道形成优势,特别是在Agentic(智能体)的自主执行力上表现突出,而OpenAI的GPT-5.5/Codex在后端开发等重度工程领域依然极其强大[12][15] 战略与商业化 - 公司核心成功因素是对Coding赛道的精准定位,以及对垂直赛道商业化变现的聚焦投入[4] - 商业化呈现分化:OpenAI依靠泛用API和庞大开发者生态占据基本盘;公司则切入高客单价的硬核安全与特殊研发市场,尽管Mythos系列定价偏高,但在特定攻防场景的ROI可观,大企业愿意买单[15] - 公司将Claude模型作为组织效率、用户增长和产品商业化的共同入口,模型从处理代码片段发展到承担端到端任务,甚至参与内部代码审查、修复bug和实验流程[14] 组织与文化 - 公司早期文化类似扁平化、决策链路短的小作坊,员工多来自OpenAI早期团队,招聘偏好“好奇、承认不知道、跨领域”,形成了高技术密度、低自我意识的团队文化[11] - 为提升效率,团队将很多产品功能周期从过去的6个月压缩到1个月甚至更短,整个公司围绕AI-native产品重新组织了研发、产品、市场和文档流程[14] - 公司由一群极度关注“AI安全与可解释性”的研究员创立,其严谨的极客基因很契合代码生成这种容错率极低的领域[15] 行业竞争格局 - 头部厂商模型处于交替领先状态,尚未有明确胜者,公司依托安全理念与Coding领域的优势暂时领跑[5] - 顶级模型之间仍是交替领先的竞争状态,并未出现真正不可追赶的代差,公司与OpenAI之间并未产生代际差距,但与其他厂商如Gemini、X.ai及国内模型的差距会更明显一些[16] - 长期竞争将围绕云生态展开,每一家大型云厂商都会拥有自己的模型体系并扶持外部生态模型公司,公司深度绑定亚马逊云生态[17] - 有观点认为,公司是目前最领先的大模型创业公司,但谷歌、微软等大型科技公司的内部闭源模型同样很强,部分能力可能已超过创业公司产品[17] 安全理念与争议 - 公司以AI安全为使命,其发展脉络中贯穿着对安全与性能边界的权衡,这种矛盾甚至成为其独树一帜的特点[7] - “安全第一”的理念是一把双刃剑,既是差异化护城河,也招致“过度谨慎”的批评,例如涉及网络安全的查询会自动回落至Opus 4.8,导致部分良性请求被拦截,前沿任务受限[6] - 公司选择开放经过切分与限制的版本,释放Coding与生产能力,同时尽量压制网络安全、攻击自动化等高风险能力,对于网络安全的访问有多层审核和控制[10]
【太平洋科技-每日观点&资讯】(2026-06-11)
远峰电子· 2026-06-10 21:41
行情速递 / Part 01 ①大盘指数,上证指数(-0.42%)/科创50 (-0.65%)/深证成指(-2.06%)/创业板指(-2.70%)/北证50 (-3.16%)/ ②TMT领涨板块,SW半导体材料(+4.71%)/SW半导体设备(+1.66%)/SW教育出版(+0.98%) / ③TMT领跌板块,SW被动元件(-5.73%)/SW LED (-5.04%)/SW面板(-4.97%)/ 国内新闻 / Part 02 ①半导体封装,华卓精科W2W熔融键合装备顺利交付/依托清华大学二十余年超精密测控技术积淀/公司顺利攻克高 精度对准、界面瑕疵管控、低温键合等多项技术壁垒/打破海外技术垄断/ ②半导体投资联盟,佰维存储科与某存储原厂签订日常经营性采购合同/总承诺采购金额为18.608亿美元/锁量锁价/承 诺采购期总计24个月/ ③半导体行业观察,中国海关总署数据显示/5月份中国出口同比增长19.4%(以美元计)/高于4月份14.1%的同比增 幅/其中/继4月份同比增长一倍之后/5月份中国半导体出口额同比飙升110%/ ④电子技术应用ChinaAET,今年下半年/东风全新一代固态电池将迎来量产装车/这款电 ...
What smart people are saying about the 2 most controversial parts of Anthropic's new models
Business Insider· 2026-06-10 21:14
文章核心观点 - Anthropic公司发布其备受期待的“Mythos级”模型Claude Fable 5和Mythos 5,但因其引入的两项特殊安全措施而引发争议,这些措施包括在怀疑用户进行前沿AI研究时秘密降低模型性能,以及将特定请求自动转给能力较弱的模型处理 [1] 模型发布与安全措施 - Anthropic发布了Claude Fable 5和Mythos 5模型 [1] - 公司披露了两项特殊安全措施:当怀疑用户在进行前沿AI研究时,模型可能秘密提供降级的协助;某些请求会自动被路由到能力较弱的模型 [1] - 公司表示,这些措施旨在降低强大AI系统帮助用户开发竞争性前沿模型或加速危险能力发展的风险 [2] 行业专家观点:对安全措施与风险的看法 - 政策专家David Kasten认为Anthropic确实在努力降低与Mythos相关的风险,但发布模型本身存在风险,因为攻击者和防御者之间总是一场“猫鼠游戏” [2][3] - 数字安全专家Davi Ottenheimer质疑Mythos是否如Anthropic之前所暗示的那样危险,他指出公司在4月份曾以安全风险为由未向公众发布该模型,但现在却将其出售给公众 [5] - Ottenheimer批评公司“将安全用作营销噱头” [6] - 研究工程师Elie Bakouch批评Anthropic故意限制Mythos在特定AI开发任务上的表现,并认为这对研究社区非常不利,且干预行为对用户不可见是“疯狂的” [8] 行业专家观点:对竞争格局与行业集中的影响 - 行业观察者Jeremy Howard认为,Anthropic的安全措施可能加剧AI行业的集中度,因为其允许自身(当前的顶级实验室)使用其顶级模型进行前沿AI研究,这会导致AI前沿进步,但权力不平衡加剧 [9] - 通讯作者Gergely Orosz指出,Anthropic试图限制竞争的做法可能会影响许多并非真正在构建竞争性AI模型的人 [11][12] - 风险投资合伙人Deedy Das关注模型能力,指出Claude Fable 5在迁移5000万行代码库、生成高级3D图形以及在优化任务上超越竞争对手模型等方面表现惊人,并称其价格与OpenAI的GPT-5.5大致相同,但比GPT-5.5 Pro便宜六倍 [13][14] 行业专家观点:对模型能力与实用性的评价 - 行业分析师Patrick Moorhead分享其首次使用Fable 5的体验令人失望,模型因认为任务“过于危险”而拒绝协助进行收益分析要点和董事会演示准备 [11] - GoodData创始人Roman Stanek认为,AI能力并非网络安全领域的真正问题,许多已知漏洞已存在20年但从未被修复,因为无论是雇佣人类工程师还是使用AI来修复,都没有人愿意付费 [7]
Thoughts on the market & Gokul/Samik’s CPO view; TSM; ANET, CIEN; FLEX-20260610
JPMorgan· 2026-06-10 21:11
市场表现 - 昨日科技股出现回调,软件领域受影响更大,主要由于CPO预期被下调及AAPL WWDC未能引发市场热情[1] - 整体市场表现疲软,SPX下跌0.7%,NDX下跌1.1%,主要受科技股拖累[14] 业绩总结 - TSMC在5月创下新高销售额为NT$4170亿(约合132亿美元),同比增长30.1%[4] - CIEN的订单积压达到77亿美元,预计在2026财年将持续增长,80%的64亿美元硬件订单将在12个月内发货[10] 用户数据与产品 - Anthropic推出Claude Fable 5,定价为每百万输入令牌10美元,每百万输出令牌50美元,相较于之前的Mythos Preview大幅降价[17] - Claude Fable 5在软件工程、知识工作、视觉、长上下文和科学研究等领域表现突出,用户体验从“施法者”转变为“委托人”[17] 未来展望 - ANET推出1.6T交换机,预计在2027年将带来显著的市场机会,市场规模预计从今年的37亿美元增长至2030年的406亿美元,年均增长率超过80%[8] - CPO的规模扩展预计将在2028年或2029年实现,主要面向非超大规模云计算客户[3] - FLEX正从组件采购转向集成模块系统,目标将利润率提升至20%,目前处于中低十位数水平[13] - AXON在无人机领域的战略定位因监管变化而迎来重大转折,预计将推动其在数据中心安全等领域的快速增长[9] 新技术与市场动态 - DDR5现货价格持续上涨,DDR4供应紧张开始影响DDR3市场,显示出市场的广泛紧张[17] - NAND现货价格因第二季度合约价格上涨而稳定,512Gb TLC晶圆现货价格本周下降0.22%,降至20.638美元[21] - TSMC首席财务官表示,持续的通货膨胀正在推高运营成本,可能会进行适度的价格调整[21] - 联想计划在7月对其产品组合进行价格上涨,因内存价格创历史新高,DRAM和NAND闪存现货价格上涨超过300%[21] 其他策略 - Crusoe暂停在怀俄明州的1.8G数据中心项目,市场情绪受到负面影响[1] - 800V直流电源的主流采用预计仍需12至18个月,当前主要依赖于±400V架构[13]
U.S. strikes Iran, SpaceX's unique IPO, Kalshi's insider trading fight and more in Morning Squawk
CNBC· 2026-06-10 20:18
This is CNBC's Morning Squawk newsletter. Subscribe here to receive future editions in your inbox. 1. 'Pay the price' A pro-government supporter waves a giant Iranian national flag during a nightly rally in northern Tehran, Iran, on June 8, 2026. Morteza Nikoubazl | Nurphoto | Getty Images Stock futures are falling before the bell after President Donald Trump said in a Truth Social post this morning that Iran "will have to pay the price" after taking "too long to negotiate a deal." His comments come after t ...
Fable 5自带反蒸馏机制!检测到就降智,误触率高到离谱
量子位· 2026-06-10 18:10
henry 发自 凹非寺 量子位 | 公众号 QbitAI 都先别急着吹! Claude刚刚发布的新模型 Fable 5 ,很多人可能压根就用不上! 有不少网友实测发现,Fable 5的安全护栏检测机制的触发几率似乎比官方宣称的 不到5% 严格得多。 无论是普通编码任务。 还是简单打个招呼,都有可能被自动路由回老模型Opus 4.8。 更离谱的是,我自己也中招了。我让Claude帮我搜点资料,丰富一下背景。 结果它想了两步,啪——切Opus了。 | 换句话说。你以为自己在用Anthropic刚发布的最强模型,实际上聊着聊着,对面已经偷偷换人了。 | | --- | | 而且不光是安全检测容易误伤,更绝的还在后头: | Anthropic还在长达319页的系统卡里埋了一套 防蒸馏 机制。 如果系统怀疑你想拿Claude的输出训练自己的AI模型,它甚至不会告诉你发生了什么,而是直接降低Fable的回答质量。 可以说,前一手防你作恶,后一手防你抄作业,相当符合A社的一贯风格。 寓言怎么老变成章鱼? 先给今天没刷新闻的大伙补个课。 今天凌晨,Anthropic终于发布了预热许久的两款模型—— 「神话」(Mythos) ...
双倍价格卖你阉割版Mythos!Claude故意降智还不告知、强制留底30天,彻底把用户惹毛
AI前线· 2026-06-10 16:29
文章核心观点 - Anthropic公司发布Claude Fable 5和Mythos 5双模型,实为同一模型(Mythos-class底座)的两种分级销售策略,面向公众的Fable 5版本受到严格的安全机制限制,而近乎无限制的Mythos 5版本仅向白名单机构(如Project Glasswing内的网络安全机构和关键基础设施企业)开放[15][16][17] - 公司在Fable 5模型中部署了用户“不可见”的干预机制,包括修改用户提示词、使用引导向量(steering vectors)或参数高效微调(PEFT)来限制模型在特定前沿研究领域(如AI模型研发、网络安全、生物化学)回答的有效性,且此过程不会主动告知用户[23][25] - 文章质疑模型能力限制的边界已从技术安全考量转向商业竞争考量,通过“防蒸馏”等机制构建“同源不同权”的分层供给特权,模型能力的实际分配正成为与原始能力同等重要的“硬核技术”[39][40] 产品策略与市场定位 - **双模型分级策略**:Claude Fable 5面向公众,Claude Mythos 5仅向“可信访问”名单开放,未来准入计划需与美国政府协商[15][16][17] - **定价差异**:Fable 5的API定价为每百万token输入10美元、输出50美元,是Opus 4.8价格的两倍[18] - **地理限制与计价**:Fable 5提供仅限美国境内推理的版本,输入输出统一按1.1倍计价[19][20] - **数据保留新规**:所有Mythos级流量的数据强制保留30天,此前签有零数据保留协议的客户也不例外[19] 模型性能与安全机制 - **基准测试表现**:在SWE-Bench Pro的Agentic coding测试中,Fable 5得分为80.3%,高于Mythos Preview的77.8%、Opus 4.8的69.2%,并显著领先于GPT5.5的58.6%、Gemini 3.1 Pro的54.2%以及DeepSeek V4-Pro Max的55.4%[2] - **性能标注说明**:官方评测分数取Mythos 5和Fable 5两者中的较高值,带星号项目因安全机制拦截,Fable 5表现更接近Opus 4.8[30][31] - **触发式回退机制**:当用户请求涉及网络安全、生物、化学、医学等“高风险”领域时,模型会通过简单的“关键词匹配”拦截,并自动无缝回退到上一代模型Opus 4.8进行回答,此机制平均触发率官方称不到5%[4][17][18][26] - **移动端敏感度**:在移动端,拦截机制可能更敏感,会删除模型输出的相关信息并替换为更安全的回答[5] 用户影响与信任危机 - **“不可见”的降智**:对于前沿大模型研发类请求,模型通过隐蔽手段限制回答有效性,用户端无任何提示或报错,导致用户无法区分“模型不会”和“模型没尽力”[10][23][27][29] - **信任关系受损**:工程师无法排除“结果不对”是否源于模型被暗中限制,摧毁了用户与工具之间基于输出稳定性的基本信任关系[28][29] - **体验不确定性**:Fable 5的用户体验成为一个概率分布,多数人获得满血性能,少数人触发降级,且用户无法预知自己处于哪个区间[32] 行业趋势与竞争动态 - **从产品到特权**:前沿模型正从“统一能力的产品”转向“分层供给的特权”,能力的边界越来越多由商业规则而非技术极限决定[39][40] - **“防蒸馏”与竞争**:公司将防止模型能力被系统性提取(“蒸馏”)作为安全机制的核心部分,并曾点名指责中国模型公司进行“工业规模的蒸馏攻击”[33][35] - **开源与闭源路线对立**:中国头部模型如Qwen和DeepSeek选择开放权重,而闭源巨头则将“防蒸馏”机制内置,同一行为在不同生态中被赋予截然不同的含义[38] - **“撤梯子”心态**:行业声音批评前沿实验室在自身借助模型能力提升后,通过限制他人访问相同能力来维持竞争优势[15]
Anthropic发布新模型:5000万行代码1天完成
新华网财经· 2026-06-10 15:59
新一代大模型发布 - Anthropic于美东时间6月9日发布新一代大模型Claude Fable 5,同步推出Claude Mythos 5,距离上一代Claude Opus 4.8发布仅间隔11天[2] - Fable 5是首个面向公众开放的Mythos级模型,定价为10美元/百万输入Token和50美元/百万输出Token,Mythos 5定价相同但保留更完整能力,目前仅向少数受信任机构开放[2] - Claude Fable 5被描述为公司迄今公开发布的能力最强通用大模型,在软件工程、科研、金融分析、视觉理解等多个领域达到业内领先水平,但对涉及网络安全、生物学和化学等敏感领域的问题进行了降权限处理[2] 模型性能与能力 - Fable 5在几乎所有测试基准上都达到业内领先水平,尤其擅长长周期、多步骤、高复杂度任务,软件开发是其最突出的能力之一[3] - 支付巨头Stripe在早期测试中发现,Fable 5在一个包含5000万行Ruby代码的大型代码库中,仅用一天时间便完成了一项原本需要一个团队两个月才能完成的代码迁移工作[3] - Mythos 5取消了部分安全限制,已能够独立完成蛋白质设计流程,在部分药物研发任务中达到甚至超过专业研究人员水平,其提出的一项关于大肠杆菌蛋白的新机制假说已获得独立实验室验证[3] 公司研发效率与内部应用 - 截至2026年5月,公司代码库中80%上线落地的程序由旗下大模型Claude自主生成,对比2024年同期,研发工程师单日有效代码产出提升8倍[5] - 搭载Mythos Preview最新模型后,科研人员工作效率达到无AI辅助状态的4倍,AI可独立完成的复杂科研任务时长翻倍周期从早年7个月缩短至当前4个月[5] - 在部分高难度算法优化场景里,人类耗时数小时仅能实现4倍算力优化,而Mythos模型可一次性完成52倍效率提升[5] 融资与估值 - 当地时间5月28日,Anthropic宣布完成H轮650亿美元融资,投后估值达9650亿美元,超越OpenAI 8520亿美元的估值[6] - 若以标普500企业市值排名,Anthropic目前规模已可跻身全美第13大企业,估值已超越英特尔和沃尔玛,仅次于伯克希尔哈撒韦[6] - 本轮融资由Altimeter Capital、Dragoneer、Greenoaks与红杉资本领投,同时包含大型云服务商此前承诺的150亿美元投资,其中亚马逊出资50亿美元,美光科技、三星电子与SK海力士也在投资方名单中[6] 财务表现与上市计划 - 截至2026年4月,Anthropic年化运营收入突破470亿美元,较2月底G轮时的300亿美元增长超50%,月均新增营收超50亿美元[7] - 公司收入结构绝大多数来自企业API调用,覆盖金融、法律、科技等领域,客单价高、粘性强[7] - 有消息称Anthropic考虑最早10月IPO,可能筹集超600亿美元资金,已于6月初向美国证券交易委员会保密提交IPO文件草案,并选择摩根士丹利和高盛担任其IPO主承销商[7] 行业定位与发展战略 - Anthropic主要瞄准企业级市场,凭借Claude模型200k超长上下文、高安全性与强推理能力,成为不少企业AI部署首选[7] - Anthropic近期曾发文呼吁全球暂停前沿AI开发,依托内部实测数据论证“递归自我改进(RSI)”的落地进程正在超预期提速[4] - 公司联合创始人表示,训练人工智能模型是一项高度资本密集型的业务,开发人工智能模型的高昂成本正迫使公司寻求上市融资[8]
Beijing escalating AI espionage to catch up with the U.S. on tech, cybersecurity firm says
CNBC· 2026-06-10 13:02
核心观点 - 网络安全巨头CrowdStrike警告称 源自中国的网络攻击活动正在加剧 其目标是窃取人工智能技术与知识产权 以缩小与美国的科技差距 [1][2] 网络攻击态势分析 - 在截至3月31日的过去12个月中 针对科技公司的国家赞助型针对性网络攻击中 超过58%可归因于中国相关实体 攻击重点尤其在于窃取AI资产 [1] - 中国相关攻击者正升级针对技术组织的间谍活动 以窃取其自身无法快速构建的AI能力和知识产权 [2] - 中国相关网络攻击还针对东南亚的政府通信 并通过利用漏洞在北美技术组织中“维持持久访问” [3] 行业背景与影响 - 美国对华AI训练芯片的限制 制约了中国的技术发展 尽管中国本土AI模型试图在提供近乎同等智能的同时削减运营成本 [2] - 今年早些时候 美国AI巨头Anthropic和OpenAI曾抱怨中国公司从美国科技公司获取竞争性情报 分析人士当时警告 非法行为的界限可能模糊 [4] - 除中国外 CrowdStrike还发现朝鲜相关实体试图渗透北美、欧洲和亚洲的IT劳动力 主要目的是为朝鲜政权创收 [5] 技术发展与应对 - 过去几周 Anthropic宣传了其最新Mythos模型的网络防护能力 并将该技术推广给CrowdStrike等公司 [5] - Anthropic于周二发布了该模型的公开版本Claude Fable 5 评级机构Artificial Analysis称其“领先其他实验室最佳模型近5分” [5]
Claude Fable 5首日实测,杀疯了…
量子位· 2026-06-10 12:12
核心观点 - Anthropic公司发布的新一代AI模型Claude Fable 5在多项实测中展现出远超行业顶级水平的性能,其能力增长打破了过往AI模型的规律性趋势,在代码生成与处理、多模态内容创作等方面表现突出[1][20] 模型性能与基准测试 - 在FC Diamond、SWE-Bench Pro等权威基准测试中,Fable 5的表现打破了过往AI模型平稳增长的数据规律,其成绩曲线“冲出了旧有的数据趋势线”[20] - 其前代旗舰模型Opus 4.8在Diamond榜单上成功率约为14%,符合顶级行业水平,而Fable 5的成功率直接冲至30%以上,实现翻倍增长[21][22] 多模态与创意生成能力 - 在“我的世界”中创建克隆版推特的测试中,Fable 5能生成结构完整、细节丰富(包括键盘、底座、清晰的像素风界面和UI层次感)的作品,效果远超竞争对手[5] - 仅用一句提示词即可复刻Adobe Photoshop的核心功能,能完成修图、调色、特效和创意绘画,例如将经典画作《创造亚当》处理为赛博朋克风格,并在色彩分离、颗粒质感等细节上还原到位[10][11] - 能够生成完整的游戏框架,仅经一次推理即可实现核心玩法、关卡逻辑和交互动画[14] - 具备构建3D世界的能力,相关项目基于Three.js实现,成品可在浏览器中直接运行[18] 代码处理与软件开发能力 - 在处理大型、杂乱的旧代码库时,模型能自动触发67次工具调用,生成超过百万行的新代码,新增24个文件,完成架构拆分和模块化改造,使代码结构变得规整[25][26] - 在清理项目冗余代码的案例中,成功删除了7000行无效代码,并使系统运行更流畅,同时完整保留了原有功能[29] - 但存在代码重构后无法正常运行的情况,且大规模代码处理消耗的资源(额度)极高,一次操作可能消耗30%的额度[27][31]