Meta，最新发布！“多模态性最强模型”

文章核心观点 Meta推出开源人工智能模型Llama 4，是应对新兴开源势力的“回击”，推动开源模型技术发展和生态完善，当前大模型竞争趋于白热化，行业进入推理强化和应用拓展阶段 [2][8] 大规模、多模态、长文本的Llama 4发布 - Meta于4月6日凌晨发布Llama 4系列首批模型，包括Llama 4 Scout、Llama 4 Maverick，还预览了Llama 4 Behemoth [3] - Llama 4是Llama系列中首批采用混合专家（MoE）架构的模型，与传统稠密模型相比，训练和推理计算效率更高 [3] - Llama 4参数规模大，Llama 4 Scout有1090亿参数、170亿激活参数量；Llama 4 Maverick有4000亿参数、170亿激活参数量；Llama 4 Behemoth总参数高达2万亿，有2880亿激活参数量 [4] - Llama 4多模态能力突出，采用早期融合技术，用无标签文本、图片和视频数据预训练，实现文本和视觉token无缝整合 [4] - Llama 4用图像和视频帧静止图像训练，支持多图像输入与文本提示交互，预训练最多用48张图像，后训练测试最多8张图像 [5] - Llama 4长文本能力有突破，Llama 4 Scout支持高达1000万token的上下文窗口，处理长文档等任务表现出色 [5] 大模型竞争趋于白热化 - Meta于2022年推出Llama系列模型，2023年开源Llama 2并可免费商用，2024年4月发布Llama 3，实现多模态处理能力 [6] - DeepSeek崛起冲击Meta在开源模型社区的领先地位，1月末有爆料称DeepSeek - V3让Llama模型相形见绌，Meta工程师分析其技术 [7] - 阿里通义千问系列开源大模型表现出色，Qwen2.5 - Omni登上Hugging Face大模型榜单总榜榜首，千问衍生模型数量超Llama系列 [7] - OpenAI计划几周后发布推理模型o3和基座模型o4 - mini，几个月后推出GPT - 5 [8] - DeepSeek与清华团队发布论文，成果被视为下一代推理模型R2的重要技术铺垫 [8] - 大模型竞争进入推理强化和应用拓展阶段，个人智能体潜力显现，开源开放成核心竞争力，大算力等成发展趋势 [8]