Workflow
Meta,最新发布!“多模态性最强模型”
Meta PlatformsMeta Platforms(US:META) 券商中国·2025-04-06 14:10

文章核心观点 Meta推出开源人工智能模型Llama 4,是应对新兴开源势力的“回击”,推动开源模型技术发展和生态完善,当前大模型竞争趋于白热化,行业进入推理强化和应用拓展阶段 [2][8] 大规模、多模态、长文本的Llama 4发布 - Meta于4月6日凌晨发布Llama 4系列首批模型,包括Llama 4 Scout、Llama 4 Maverick,还预览了Llama 4 Behemoth [3] - Llama 4是Llama系列中首批采用混合专家(MoE)架构的模型,与传统稠密模型相比,训练和推理计算效率更高 [3] - Llama 4参数规模大,Llama 4 Scout有1090亿参数、170亿激活参数量;Llama 4 Maverick有4000亿参数、170亿激活参数量;Llama 4 Behemoth总参数高达2万亿,有2880亿激活参数量 [4] - Llama 4多模态能力突出,采用早期融合技术,用无标签文本、图片和视频数据预训练,实现文本和视觉token无缝整合 [4] - Llama 4用图像和视频帧静止图像训练,支持多图像输入与文本提示交互,预训练最多用48张图像,后训练测试最多8张图像 [5] - Llama 4长文本能力有突破,Llama 4 Scout支持高达1000万token的上下文窗口,处理长文档等任务表现出色 [5] 大模型竞争趋于白热化 - Meta于2022年推出Llama系列模型,2023年开源Llama 2并可免费商用,2024年4月发布Llama 3,实现多模态处理能力 [6] - DeepSeek崛起冲击Meta在开源模型社区的领先地位,1月末有爆料称DeepSeek - V3让Llama模型相形见绌,Meta工程师分析其技术 [7] - 阿里通义千问系列开源大模型表现出色,Qwen2.5 - Omni登上Hugging Face大模型榜单总榜榜首,千问衍生模型数量超Llama系列 [7] - OpenAI计划几周后发布推理模型o3和基座模型o4 - mini,几个月后推出GPT - 5 [8] - DeepSeek与清华团队发布论文,成果被视为下一代推理模型R2的重要技术铺垫 [8] - 大模型竞争进入推理强化和应用拓展阶段,个人智能体潜力显现,开源开放成核心竞争力,大算力等成发展趋势 [8]