Meta 憋了 9 个月的大招揭晓了

公司动态：Meta发布自研大模型Muse Spark及其战略调整 - 公司旗下超级智能实验室（MSL）在经历9个月的闭门研发后，于4月9日官宣首款自研大模型Muse Spark，该模型已在meta.ai网站和Meta AI App上线，并向部分用户开放API预览版 [4] - 受此消息提振，公司股价当日一度大涨近9%，创下自今年1月以来最大单日涨幅，收盘时上涨6.5% [4] - 公司对AI团队进行了重大重组，在Llama4造假争议后，对原团队大幅裁员，并启动激进的人才招募计划，同时斥资143亿美元收购数据标注公司Scale AI近49%的股权，并任命其联合创始人汪滔为首席人工智能官，领导MSL [5][6] - 公司此次选择将Muse Spark闭源，与过去开源Llama系列的做法不同，公司计划未来向更广泛用户提供付费API访问，并探索模型的营利方式 [13][14] 产品性能：Muse Spark的综合表现与优劣势分析 - 根据第三方评测机构Artificial Analysis的评分，Muse Spark的综合智能指数为52分，排名全球第四，高于Llama4的18分，标志着公司大模型表现进入全球第一梯队 [8][9] - 模型在多个基准测试中表现突出：在CharXiv Reasoning（图表科学推理）测试中获得86.4分，领先于其他竞争对手；在HealthBench Hard（开放式健康问答）测试中获得42.8分，大幅领先于GPT-5.4的40.1分、Gemini 3.1 Pro的20.6分和Opus 4.6的14.8分 [12][13] - 模型在某些领域存在明显短板：在考验高难度专业知识的Humanity's Last Exam with tools（HLE）中得分为50.4分，在五个主流大模型中排名最末；在纯视觉抽象推理测试ARC AGI 2中得分为42.5分，远低于表现最佳的Gemini 3.1 Pro的76.5分；编程能力是其相对短板，在LiveCodeBench Pro中得80分，低于GPT-6.4的87.5分，在Terminal-Bench 2.0中得59分，低于GPT5.4的75.1分 [11][12] 行业竞争与公司战略 - 公司在AI大模型领域的研发策略从追求“开放科学”的理想转向更务实的商业应用，核心思路是利用大模型盈利并服务其30亿用户生态 [13][14] - 公司计划将Muse Spark深度整合至其产品生态，未来几周将接入Facebook、Instagram、WhatsApp以及智能硬件，并推出购物模式，根据用户在社交平台上的偏好进行个性化购物推荐 [14] - 公司强调健康领域是当前押注的方向，已与超过1000名医生合作训练模型，旨在生成更详细的营养和运动主题回答，显示出其在垂直领域应用的战略聚焦 [13]