太强了不敢公开!Anthropic推出“神话”新模型,暂时仅限科技巨头试用
华尔街见闻·2026-04-08 12:35

文章核心观点 - Anthropic公司推出名为“Project Glasswing”的行业联合项目,联合亚马逊、苹果、微软、思科等科技巨头,将其尚未公开发布的新一代顶级AI模型Claude Mythos Preview用于关键软件基础设施的漏洞扫描与修复,以应对AI驱动的网络安全威胁,旨在让防御者获得先手优势[3][5][6][19] - Claude Mythos Preview模型在代码和网络安全能力上远超其前代模型,已发现并协助修复了多个存在数十年、历经数百万次自动化测试也未被发现的严重漏洞,且发现漏洞的成本效率约为前代AI模型的10倍[7][9][10][17][18] - Anthropic公司年化营收在约一个月内从190亿美元跃升至超过300亿美元,增速超越竞争对手OpenAI,并可能提前实现现金流转正及IPO[29][30][31] Claude Mythos Preview模型的技术能力 - 在代码基准测试SWE-bench Verified上,Mythos Preview得分达93.9%,显著高于同期Claude Opus 4.6的80.8%[9] - 在专项网络安全基准CyberGym上,Mythos Preview得分83.1%,同样领先于Opus 4.6的66.6%[10] - 在AI代理搜索与计算机使用方面,Mythos模型预览版本也领先于Opus 4.6[12] - 模型发现了OpenBSD中一个存在27年的远程崩溃漏洞[14] - 模型在FFmpeg中发现了一个16年前埋下的漏洞,而定位该漏洞的那行代码此前已被自动化测试工具扫描超过500万次,从未触发警报[15] - 模型在Linux内核中自主发现并串联多个漏洞,构建出从普通用户权限提升至完全控制机器的完整攻击链[16] - 以每发现一个漏洞的美元成本衡量,Mythos Preview的效率约为前代AI模型的10倍[18] Project Glasswing项目详情 - 项目联合了12家合作伙伴,涵盖云计算、终端安全、芯片设计、金融基础设施和开源社区等核心领域[19] - 亚马逊AWS已将Mythos Preview应用于关键代码库的安全强化工作,其每天分析超过400万亿次网络流量[20] - 微软表示该模型在微软开源安全基准CTI-REALM上的表现“较前代模型有实质性提升”[21] - 摩根大通将以严格、独立的方式评估该工具在金融关键基础设施防御中的应用价值[23] - 项目通过向40余家开源及关键基础设施机构提供模型访问权限,以弥补开源维护者安全资源匮乏的缺口[23][24] - Anthropic承诺在90天内发布公开报告,披露已发现的漏洞数量、修复情况及可公开的改进成果[24] - 在政策层面,公司计划与主要安全机构合作,就漏洞披露、软件更新、开源与供应链安全等方向形成实践建议[24] Anthropic公司的商业模式与财务表现 - Anthropic年化营收在约一个月内从190亿美元跃升至超过300亿美元,较去年年底水平增长超过三倍,已超越其去年12月设定的320亿美元年底目标[29] - 这一营收水平已超越OpenAI,后者在今年2月底的年化营收约为250亿美元[29] - 营收增速的差异部分源于会计处理:Anthropic将通过AWS、微软及谷歌销售Claude所获得的全部收入纳入统计,而OpenAI通过Microsoft Azure销售模型时仅将20%的销售额计入收入。即使调整会计口径,OpenAI的营收仍不足以弥补当前差距[29] - 强劲的营收增势为公司IPO预期提供支撑,公司预计于2028年实现现金流转正,较OpenAI的同类预测早两年,若收入保持当前增速,现金流正转时间或进一步提前[30][31] - 公司面临算力瓶颈、利润率压力及增速可持续性等制约因素[32][33] 模型发布与安全策略 - 由于Claude Mythos Preview模型能力过于强大,Anthropic目前暂无向公众开放的计划,其最终目标是开发出足够可靠的安全防护机制后,再逐步推进更高能力模型的开放[5][26][27] - 研究预览期结束后,Claude Mythos Preview将向计划参与方提供商业访问,定价为每百万输入/输出token 25/125美元[27] - 在资金层面,公司通过Linux基金会向Alpha-Omega和OpenSSF捐赠250万美元,向Apache软件基金会捐赠150万美元[28] - 公司已就Mythos Preview的攻防能力与美国政府官员展开持续沟通,认为维护民主国家在AI领域的决定性领先优势是当前重要的国家安全优先事项[28]

太强了不敢公开!Anthropic推出“神话”新模型,暂时仅限科技巨头试用 - Reportify