Seek .-关税刷屏的一周，AI圈也“暗流涌动”：Llama 4来了，O3和O4-mini也要来了，DeepSeek R2和GPT-5也不远了？

文章核心观点本周全球聚焦关税议题，科技界目光集中在AI领域，Meta发布Llama 4系列，OpenAI宣布O3和O4 - mini上线及GPT - 5推迟，DeepSeek与清华联合发布新论文 [1] Meta发布Llama 4系列 - Meta周六发布Llama 4系列模型，全系采用混合专家（MoE）架构，实现原生多模态训练 [2] - 发布模型包括Llama 4 Scout（17B激活参数，109B总参数量，支持1000万 + Token上下文窗口，可在单张H100 GPU上运行）、Llama 4 Maverick（17B激活参数，400B总参数量，上下文窗口100万 + ，性能优于GPT - 4o和Gemini 2.0 Flash）、Llama 4 Behemoth预览（288B激活参数，2万亿总参数量，训练使用32000块GPU和30万亿多模态Token） [7] - Llama 4 Scout和Maverick是开源软件，但新许可证对使用有限制，月活用户超7亿的公司需申请特殊许可并遵守多项品牌和归属要求 [4] - Meta强调Llama 4 Scout和Maverick是“迄今为止最先进的型号”“同类产品中多模态性最好的版本” [6] - Llama 4 Scout速度极快，原生支持多模态，拥有业界领先的1000万 + Token多模态上下文窗口，Int4量化后能在单张H100 GPU上运行；Maverick在多个主流基准测试中击败GPT - 4o和Gemini 2.0 Flash，推理和编码能力与DeepSeek v3相当，但激活参数量不到后者一半 [13] - Llama 4 Behemoth仍处训练中，被定位为“世界上最智能的LLM之一”，有网友指出其训练的性能潜力，在阶段已表现出超越Claude 3.7和Gemini 2.0 Pro的能力 [9] - Meta计划今年投入高达650亿美元扩展其AI基础设施 [10] OpenAI模型动态 - OpenAI首席执行官确认O3和O4 - mini将在未来几周内发布，GPT - 5将在未来几个月与公众见面 [11] - OpenAI改进了O3模型，会让用户满意 [14] - GPT - 5将整合语音、Canvas、搜索、Deep Research等多项功能，成为统一模型战略的核心，是集成多种工具和功能的综合系统，能自主使用工具，胜任复杂任务 [15] - GPT - 5将对免费用户开放无限使用权限，付费用户体验更高智力水平版本，因DeepSeek影响考虑让用户免费使用，发布时间反复推迟 [15] DeepSeek与清华合作成果 - DeepSeek与清华大学研究团队联合发布关于推理时Scaling的新论文，提出自我原则点评调优（SPCT）学习方法，构建DeepSeek - GRM系列模型 [17] - SPCT方法将“原则”变为奖励生成一部分，包括拒绝式微调冷启动阶段和基于规则的在线强化学习优化阶段，引入元奖励模型提升输出准确性和可靠性 [19] - DeepSeek - GRM - 27B在多个RM基准测试中显著优于现有方法和模型，在推理时扩展性方面表现出色，增加推理计算资源有强大性能提升潜力，成果或在DeepSeek R2展示 [21]