文章核心观点 本周全球聚焦关税议题,科技界目光集中在AI领域,Meta发布Llama 4系列,OpenAI宣布O3和O4 - mini上线及GPT - 5推迟,DeepSeek与清华联合发布新论文 [1] Meta发布Llama 4系列 - Meta周六发布Llama 4系列模型,全系采用混合专家(MoE)架构,实现原生多模态训练 [2] - 发布模型包括Llama 4 Scout(17B激活参数,109B总参数量,支持1000万 + Token上下文窗口,可在单张H100 GPU上运行)、Llama 4 Maverick(17B激活参数,400B总参数量,上下文窗口100万 + ,性能优于GPT - 4o和Gemini 2.0 Flash)、Llama 4 Behemoth预览(288B激活参数,2万亿总参数量,训练使用32000块GPU和30万亿多模态Token) [7] - Llama 4 Scout和Maverick是开源软件,但新许可证对使用有限制,月活用户超7亿的公司需申请特殊许可并遵守多项品牌和归属要求 [4] - Meta强调Llama 4 Scout和Maverick是“迄今为止最先进的型号”“同类产品中多模态性最好的版本” [6] - Llama 4 Scout速度极快,原生支持多模态,拥有业界领先的1000万 + Token多模态上下文窗口,Int4量化后能在单张H100 GPU上运行;Maverick在多个主流基准测试中击败GPT - 4o和Gemini 2.0 Flash,推理和编码能力与DeepSeek v3相当,但激活参数量不到后者一半 [13] - Llama 4 Behemoth仍处训练中,被定位为“世界上最智能的LLM之一”,有网友指出其训练的性能潜力,在阶段已表现出超越Claude 3.7和Gemini 2.0 Pro的能力 [9] - Meta计划今年投入高达650亿美元扩展其AI基础设施 [10] OpenAI模型动态 - OpenAI首席执行官确认O3和O4 - mini将在未来几周内发布,GPT - 5将在未来几个月与公众见面 [11] - OpenAI改进了O3模型,会让用户满意 [14] - GPT - 5将整合语音、Canvas、搜索、Deep Research等多项功能,成为统一模型战略的核心,是集成多种工具和功能的综合系统,能自主使用工具,胜任复杂任务 [15] - GPT - 5将对免费用户开放无限使用权限,付费用户体验更高智力水平版本,因DeepSeek影响考虑让用户免费使用,发布时间反复推迟 [15] DeepSeek与清华合作成果 - DeepSeek与清华大学研究团队联合发布关于推理时Scaling的新论文,提出自我原则点评调优(SPCT)学习方法,构建DeepSeek - GRM系列模型 [17] - SPCT方法将“原则”变为奖励生成一部分,包括拒绝式微调冷启动阶段和基于规则的在线强化学习优化阶段,引入元奖励模型提升输出准确性和可靠性 [19] - DeepSeek - GRM - 27B在多个RM基准测试中显著优于现有方法和模型,在推理时扩展性方面表现出色,增加推理计算资源有强大性能提升潜力,成果或在DeepSeek R2展示 [21]
关税刷屏的一周,AI圈也“暗流涌动”:Llama 4来了,O3和O4-mini也要来了,DeepSeek R2和GPT-5也不远了?