Meta 憋了 9 个月的大招揭晓了

公司动态:Meta发布自研大模型Muse Spark及其战略调整 - 公司旗下超级智能实验室(MSL)在经历9个月的闭门研发后,于4月9日官宣首款自研大模型Muse Spark,该模型已在meta.ai网站和Meta AI App上线,并向部分用户开放API预览版 [4] - 受此消息提振,公司股价当日一度大涨近9%,创下自今年1月以来最大单日涨幅,收盘时上涨6.5% [4] - 公司对AI团队进行了重大重组,在Llama4造假争议后,对原团队大幅裁员,并启动激进的人才招募计划,同时斥资143亿美元收购数据标注公司Scale AI近49%的股权,并任命其联合创始人汪滔为首席人工智能官,领导MSL [5][6] - 公司此次选择将Muse Spark闭源,与过去开源Llama系列的做法不同,公司计划未来向更广泛用户提供付费API访问,并探索模型的营利方式 [13][14] 产品性能:Muse Spark的综合表现与优劣势分析 - 根据第三方评测机构Artificial Analysis的评分,Muse Spark的综合智能指数为52分,排名全球第四,高于Llama4的18分,标志着公司大模型表现进入全球第一梯队 [8][9] - 模型在多个基准测试中表现突出:在CharXiv Reasoning(图表科学推理)测试中获得86.4分,领先于其他竞争对手;在HealthBench Hard(开放式健康问答)测试中获得42.8分,大幅领先于GPT-5.4的40.1分、Gemini 3.1 Pro的20.6分和Opus 4.6的14.8分 [12][13] - 模型在某些领域存在明显短板:在考验高难度专业知识的Humanity's Last Exam with tools(HLE)中得分为50.4分,在五个主流大模型中排名最末;在纯视觉抽象推理测试ARC AGI 2中得分为42.5分,远低于表现最佳的Gemini 3.1 Pro的76.5分;编程能力是其相对短板,在LiveCodeBench Pro中得80分,低于GPT-6.4的87.5分,在Terminal-Bench 2.0中得59分,低于GPT5.4的75.1分 [11][12] 行业竞争与公司战略 - 公司在AI大模型领域的研发策略从追求“开放科学”的理想转向更务实的商业应用,核心思路是利用大模型盈利并服务其30亿用户生态 [13][14] - 公司计划将Muse Spark深度整合至其产品生态,未来几周将接入Facebook、Instagram、WhatsApp以及智能硬件,并推出购物模式,根据用户在社交平台上的偏好进行个性化购物推荐 [14] - 公司强调健康领域是当前押注的方向,已与超过1000名医生合作训练模型,旨在生成更详细的营养和运动主题回答,显示出其在垂直领域应用的战略聚焦 [13]

Meta 憋了 9 个月的大招揭晓了 - Reportify