Meta，重磅发布！

Meta推出Llama 4开源AI模型 - Meta发布Llama 4系列首批模型，包括Llama 4 Scout和Llama 4 Maverick两个版本，是公司迄今为止最先进的模型，也是同类产品中多模态性最强的模型 [1][5] - Llama 4是Llama系列模型中首批采用混合专家（MoE）架构的模型，与传统的稠密模型相比，MoE架构中单独的token只会激活全部参数中的一小部分，训练和推理的计算效率更高 [7] - Llama 4 Behemoth是Meta未来最强大的AI模型之一，总参数高达2万亿，作为对照，DeepSeek-R1总参数规模为6710亿 [8] Llama 4的技术特点 - 参数规模大：Llama 4 Scout共有16位"专家"、1090亿参数、170亿激活参数量；Llama 4 Maverick有128位"专家"、4000亿参数、170亿激活参数量；Llama 4 Behemoth具有2880亿激活参数量 [8] - 多模态能力突出：采用早期融合（Early Fusion）技术，可以用海量的无标签文本、图片和视频数据预训练模型，实现文本和视觉token无缝整合 [8] - 长文本能力突破：Llama 4 Scout模型支持高达1000万token的上下文窗口，刷新了开源模型的纪录，市场上其他领先模型如GPT-4o也未能达到此规模 [9] 开源模型竞争格局 - Meta是开源模型的重要奠基者，2023年开源Llama 2并免费商用，激活了开发者社区的创新潜力，基于Llama 2构建的应用项目数量大大增加 [11] - DeepSeek的崛起对Meta在开源模型社区的领先地位构成巨大冲击，仅用550万美元训练的DeepSeek-V3在基准测试中表现优于Llama模型 [12] - 阿里巴巴通义千问系列开源大模型也表现优异，阿里至今已向全球开源200多款模型，千问衍生模型数量突破10万，超越美国Llama系列 [12] 行业发展趋势 - OpenAI计划在几周后发布最新的推理模型o3和基座模型o4-mini，几个月后推出GPT-5 [13] - DeepSeek与清华大学研究团队联合发布重磅论文，提出两项核心技术，为提升大语言模型的推理能力提供新方法论 [13] - 大模型竞争进入推理强化和应用拓展的下半场，开源开放日益成为大模型的核心竞争力 [13]