GPT-5 之后，我们离 AGI 更近了，还是更远了？

产品发布与市场定位 - OpenAI于2025年8月8日发布GPT-5，距离GPT-4发布间隔939天[2] - 公司首席执行官Sam Altman将产品定位为“随需应变的博士级专家团队”，强调其核心价值从“聊天”转向“做事”[4] - OpenAI研究员Tina Kim宣布公司将淘汰所有旧模型，终结“模型动物园”时代[6] 技术架构与性能特点 - GPT-5采用统一智能系统架构，包含快速模型（gpt-5-main）、深度推理模型（gpt-5-thinking）和实时路由器（real-time router）[5] - 模型支持文本和图像输入，仅输出文本，输入限制为272,000个token，输出限制为128,000个token[5] - 通过API提供常规、迷你和纳米三种模型规格，每种可在最小、低、中或高四种推理级别运行[5] - 官方宣称在减少幻觉、提高指令遵循能力方面取得显著进展，特别针对编程、写作和健康三大常用场景进行优化[26] 市场竞争与定价策略 - API定价为每百万输入token 1.25美元，比GPT-4o便宜50%，低于Claude Opus 4.1的15美元和Gemini 2.5 Pro的2.5美元[16][17] - 迷你版和纳米版定价分别为每百万输入token 0.25美元和0.05美元，低于亚马逊Nova Lite的0.06美元[17] - 发布会期间出现竞争对手动态，马斯克宣称Grok 4在ARC-AGI-2基准测试中击败GPT-5[12] 实际应用与生态影响 - 演示显示GPT-5能在两分钟内根据自然语言指令生成完整交互式网站，包括闪卡、测验和游戏功能[14] - 在复杂生产代码修改测试中，GPT-5成功完成Gemini 2.5 Pro和Claude 4 Opus失败的任务[16] - Cursor公司CEO Michael Truell在发布会演示中让GPT-5解决GitHub上悬挂三周的issue，评价其为“第一次信任模型完成最重要工作”[16] - 但文本写作能力引发争议，用户反馈显示其表现不及专门进行情感特化的GPT-4.5模型[18][21] 安全性能与行业趋势 - 系统卡片显示模型通过安全完成方法防止生成不允许内容，并训练深度推理模型在无法完成任务时诚实承认[26][27] - 抵抗提示注入攻击的能力达到56.8%，意味着仍有近半数攻击有效[29] - 行业观察指出Transformer架构可能达到瓶颈期，AI发展从“大航海时代”进入更成熟的“工业时代”[30]