关税刷屏的一周，AI圈也暗流涌动：Llama 4来了，O3和O4-mini也要来了，DeepSeek R2和GPT-5也不远了？

文章核心观点本周科技界聚焦AI领域，Meta发布Llama 4系列，OpenAI确认O3和O4 - mini上线及GPT - 5推迟发布，DeepSeek与清华联合发布新论文推动AI技术发展 [3][4] 各公司动态总结 Meta推出Llama 4系列 - Meta周六发布Llama 4系列，全系采用混合专家架构，实现原生多模态训练，告别纯文本模型时代 [6] - 发布模型包括开源的Llama 4 Scout和Llama 4 Maverick，以及Llama 4 Behemoth预览版，新许可证对使用有一定限制 [6] - Llama 4 Scout速度快，原生支持多模态，有1000万 + Token多模态上下文窗口，可在单张H100 GPU上运行 [9] - Llama 4 Maverick在主流基准测试中击败GPT - 4o和Gemini 2.0 Flash，推理和编码能力与DeepSeek v3相当，激活参数量不到后者一半 [9] - Llama 4 Behemoth仍在训练，定位为“世界上最智能的LLM之一”，展现Meta雄厚实力，有网友指出其训练性能潜力 [10] - Meta计划今年投入高达650亿美元扩展AI基础设施 [14] OpenAI模型发布动态 - OpenAI首席执行官确认O3和O4 - mini未来几周发布，GPT - 5未来几个月发布 [16] - GPT - 5将整合多项功能，成为集成多种工具和功能的综合系统，实现自主使用工具，胜任复杂任务 [20] - GPT - 5将对免费用户开放无限使用权限，付费用户体验更高智力水平版本，因DeepSeek影响考虑免费策略 [20] DeepSeek与清华合作成果 - DeepSeek与清华研究团队联合发布推理时Scaling新论文，提出SPCT学习方法，构建DeepSeek - GRM系列模型 [25] - SPCT方法包括拒绝式微调冷启动和基于规则的在线强化学习优化生成内容，提升奖励质量和推理扩展性 [27] - 引入元奖励模型过滤低质量样本，提升最终输出准确性和可靠性 [28] - DeepSeek - GRM - 27B在多个RM基准测试中表现出色，为AI模型应用提供新技术路径，可能在DeepSeek R2展示成果 [30]