Llama4：声势浩大的发布，但模型表现差强人意

报告行业投资评级未提及报告的核心观点 - 2025年4月6日Meta发布的Llama 4系列模型发布声势浩大但实际应用表现不佳，存在性能和开源性不足问题，此次发布不成功 [1][4] - Llama 4代码能力薄弱，内部有创新瓶颈与组织效率问题，发布可能是应对DeepSeek V3竞争压力的被动回应，若无法在现实任务中兑现能力，Meta在开源社区地位将受挑战，Llama 4已不属于开源模型第一梯队，DeepSeek仍领先 [4] 根据相关目录分别进行总结事件 - 2025年4月6日Meta发布最新开源AI模型系列Llama 4，包含Llama 4 Scout和Llama 4 Maverick两个模型 [1] 模型表现 - Llama 4 Scout是轻量级模型，能在单个Nvidia H100 GPU上运行，支持最多1000万个tokens的上下文窗口，在多个基准测试中优于Google的Gemma 3和Mistral 3.1等模型 [2] - Llama 4 Maverick是大型模型，有4000亿总参数，活跃参数170亿，采用128专家的Mixture - of - Experts（MoE）架构，在推理和编程任务中表现接近OpenAI的GPT - 4o和DeepSeek - V3，且活跃参数更少 [2] 模型短板 - Llama 4核心能力有短板，智能得分落后于顶级模型，在通用推理、科研任务和代码能力上不及顶级模型，Maverick平台智能指数得分仅49，远低于Gemini 2.5 Pro的68分和DeepSeek R1的66分 [3] - Llama 4为“跑分”优化，不适用于现实场景，后训练阶段为提升基准测试成绩特别调校，可能削弱真实应用能力，在“20个弹跳球”等常规测试中表现不佳，不适合高要求编程任务 [3] - Llama 4开源程度不及DeepSeek R1，DeepSeek R1以MIT协议允许几乎无限制自由使用、修改、再分发及商业化，Llama 4附带更严格使用限制，如对活跃用户数超过7亿的企业有限制 [3]