GPT-5 之后，我们离 AGI 更近了，还是更远了？

GPT-5发布背景 - GPT-4发布于2023年3月15日引发行业震动但仅是AI技术爆发的序章[1][2][3] - GPT-5于2025年8月8日发布距离GPT-4发布间隔939天行业期待值极高但实际反响复杂[4] - 发布会基调从"聊天"转向"做事" 强调实用主义定位为"随需应变的博士级专家团队"[6] 技术架构创新 - 采用统一智能系统架构包含快速模型(gpt-5-main)和深度推理模型(gpt-5-thinking) 通过实时路由器动态调度[7] - 提供三种API模型规格(常规/迷你/纳米)和四种推理级别(最小/低/中/高) 输入限制272k token 输出限制128k token[7][9] - 淘汰旧有"模型动物园"模式建立统一协同的智能有机体[9] 性能表现 - 基准测试成绩突出：AIME 2025数学测试94.6% SWE-Bench编程测试74.9% MMMU多模态理解84.2%[16] - 发布会现场出现数据可视化错误 69.1%柱状图比52.8%更短引发质疑[13] - 马斯克宣称Grok 4在ARC-AGI-2测试中击败GPT-5[15] 核心能力聚焦 - 专注三大核心场景：编程/写作/健康咨询其他多模态功能(音频/图像)暂不整合[19][28] - 编程能力显著提升可完成生产级代码修改在复杂项目中表现优于Gemini 2.5 Pro和Claude 4 Opus[21] - 写作能力存在争议不及情感特化的GPT-4.5 但Sam Altman宣称已有显著改进[24][25][27] 商业策略 - API定价极具侵略性：每百万输入Token仅1.25美元较GPT-4o降价50%[21] - 对比此前失败的GPT-4.5(原价180美元/百万输出)形成强烈反差[22] - 采取以利润换市场策略意图快速建立开发者生态[21] 技术挑战 - 模型幻觉问题持续改进通过"安全完成"训练方法和诚实应答机制降低错误率[28][30] - 提示注入攻击防御能力达56.8% 但仍有较大改进空间[32][34] - 行业观点认为Transformer架构可能已达瓶颈需要新的架构突破实现AGI[36] 行业影响 - 标志AI发展进入"工业时代" 从探索期转向专业化应用阶段[37] - 对开发者形成利好提供更可靠的生产力工具[38] - 普通用户DAU持续增长但专业用户评价分化[4][35]