产品发布与市场定位 - OpenAI于2025年8月8日发布GPT-5,距离GPT-4发布间隔939天[2] - 公司首席执行官Sam Altman将产品定位为“随需应变的博士级专家团队”,强调其核心价值从“聊天”转向“做事”[4] - OpenAI研究员Tina Kim宣布公司将淘汰所有旧模型,终结“模型动物园”时代[6] 技术架构与性能特点 - GPT-5采用统一智能系统架构,包含快速模型(gpt-5-main)、深度推理模型(gpt-5-thinking)和实时路由器(real-time router)[5] - 模型支持文本和图像输入,仅输出文本,输入限制为272,000个token,输出限制为128,000个token[5] - 通过API提供常规、迷你和纳米三种模型规格,每种可在最小、低、中或高四种推理级别运行[5] - 官方宣称在减少幻觉、提高指令遵循能力方面取得显著进展,特别针对编程、写作和健康三大常用场景进行优化[26] 市场竞争与定价策略 - API定价为每百万输入token 1.25美元,比GPT-4o便宜50%,低于Claude Opus 4.1的15美元和Gemini 2.5 Pro的2.5美元[16][17] - 迷你版和纳米版定价分别为每百万输入token 0.25美元和0.05美元,低于亚马逊Nova Lite的0.06美元[17] - 发布会期间出现竞争对手动态,马斯克宣称Grok 4在ARC-AGI-2基准测试中击败GPT-5[12] 实际应用与生态影响 - 演示显示GPT-5能在两分钟内根据自然语言指令生成完整交互式网站,包括闪卡、测验和游戏功能[14] - 在复杂生产代码修改测试中,GPT-5成功完成Gemini 2.5 Pro和Claude 4 Opus失败的任务[16] - Cursor公司CEO Michael Truell在发布会演示中让GPT-5解决GitHub上悬挂三周的issue,评价其为“第一次信任模型完成最重要工作”[16] - 但文本写作能力引发争议,用户反馈显示其表现不及专门进行情感特化的GPT-4.5模型[18][21] 安全性能与行业趋势 - 系统卡片显示模型通过安全完成方法防止生成不允许内容,并训练深度推理模型在无法完成任务时诚实承认[26][27] - 抵抗提示注入攻击的能力达到56.8%,意味着仍有近半数攻击有效[29] - 行业观察指出Transformer架构可能达到瓶颈期,AI发展从“大航海时代”进入更成熟的“工业时代”[30]
GPT-5 之后,我们离 AGI 更近了,还是更远了?
36氪·2025-08-08 15:10