Workflow
GPT-5官宣发布前,谷歌和Anthorpic继续给OpenAI上强度
36氪·2025-08-07 17:01

核心观点 - OpenAI宣布GPT-5发布会将于北京时间周五凌晨1点举行 同时推出三个版本:GPT-5、GPT-5-mini和GPT-5-nano [1][2] - 谷歌DeepMind发布Genie 3 可一句话生成分钟级720p可交互3D世界 被称为通往AGI的关键拼图 [5][7][13] - Anthropic发布Claude Opus 4 1 在AI编程领域取得SOTA成绩 SWE-bench准确率达74 5% [14][15] - OpenAI时隔6年再次开源 推出gpt-oss-120b和gpt-oss-20b两款推理模型 性能接近闭源SOTA模型 [20][22][25] 产品发布 OpenAI - 将发布GPT-5系列产品 包括GPT-5、GPT-5-mini和GPT-5-nano三个版本 [1][2] - 开源两款推理模型gpt-oss-120b和gpt-oss-20b 分别拥有1170亿和210亿参数 [20] - gpt-oss-120b性能接近o4-mini 在竞赛编程和健康任务上表现优异 [22][25][29] - 采用MoE架构 支持128k上下文输入 使用改进版o200k_harmony分词器 [26] 谷歌DeepMind - 发布Genie 3世界模拟器 可一句话生成720p、24fps的可交互3D世界 [5][7] - 支持分钟级交互 视觉记忆可追溯 可实时用Prompt改变3D世界 [9] - 正用于训练通用型3D虚拟环境智能体SIMA 推动具身智能发展 [11] - 被业界视为通往AGI的关键技术 [13] Anthropic - 发布Claude Opus 4 1 在SWE-bench上以74 5%准确率成为AI编程新SOTA [14][15] - 在Agentic terminal coding测试中达43 3% 领先竞品 [15] - 网友实测显示其编程效果最符合物理规律 [18] 技术对比 Genie系列演进 - 分辨率从Genie 2的360p提升至Genie 3的720p [8] - 交互时长从10-20秒延长至分钟级 实现实时交互 [8][9] - 应用领域从特定游戏扩展至通用场景 [8] 模型性能 - gpt-oss-120b在MMLU得90分 GPQA Diamond得80 1分 接近o4-mini [23] - Claude Opus 4 1在编程任务上领先OpenAI o3和Gemini 2 5 Pro [15] - Genie 3在画质和交互时长上显著优于前代产品 [8][9] 行业影响 - 三家公司密集发布新品 将AI竞争强度推向新高 [1][2][4] - 谷歌Genie 3被视为战略布局 为AGI发展奠定基础 [31] - OpenAI开源动作意在重建开源社区领导地位 [32] - GPT-5发布将成为行业新起点 开启下一阶段竞争 [1][32]