报告行业投资评级 未提及 报告的核心观点 - 2025年4月6日Meta发布的Llama 4系列模型发布声势浩大但实际应用表现不佳,存在性能和开源性不足问题,此次发布不成功 [1][4] - Llama 4代码能力薄弱,内部有创新瓶颈与组织效率问题,发布可能是应对DeepSeek V3竞争压力的被动回应,若无法在现实任务中兑现能力,Meta在开源社区地位将受挑战,Llama 4已不属于开源模型第一梯队,DeepSeek仍领先 [4] 根据相关目录分别进行总结 事件 - 2025年4月6日Meta发布最新开源AI模型系列Llama 4,包含Llama 4 Scout和Llama 4 Maverick两个模型 [1] 模型表现 - Llama 4 Scout是轻量级模型,能在单个Nvidia H100 GPU上运行,支持最多1000万个tokens的上下文窗口,在多个基准测试中优于Google的Gemma 3和Mistral 3.1等模型 [2] - Llama 4 Maverick是大型模型,有4000亿总参数,活跃参数170亿,采用128专家的Mixture - of - Experts(MoE)架构,在推理和编程任务中表现接近OpenAI的GPT - 4o和DeepSeek - V3,且活跃参数更少 [2] 模型短板 - Llama 4核心能力有短板,智能得分落后于顶级模型,在通用推理、科研任务和代码能力上不及顶级模型,Maverick平台智能指数得分仅49,远低于Gemini 2.5 Pro的68分和DeepSeek R1的66分 [3] - Llama 4为“跑分”优化,不适用于现实场景,后训练阶段为提升基准测试成绩特别调校,可能削弱真实应用能力,在“20个弹跳球”等常规测试中表现不佳,不适合高要求编程任务 [3] - Llama 4开源程度不及DeepSeek R1,DeepSeek R1以MIT协议允许几乎无限制自由使用、修改、再分发及商业化,Llama 4附带更严格使用限制,如对活跃用户数超过7亿的企业有限制 [3]
Llama4:声势浩大的发布,但模型表现差强人意
海通国际证券·2025-04-10 23:35