模型升级概述 - OpenAI发布了ChatGPT默认模型的新版本GPT-5.5 Instant,该模型结合了GPT-5.5的基础智力与极速回复能力 [1][2] - 此次升级对免费用户开放 [3] - 该模型从5月5日开始向所有ChatGPT用户滚动上线,将替代GPT-5.3 Instant作为默认模型 [36] - 在API中对应的模型是chat-latest [38] 核心性能提升:事实准确性与幻觉减少 - 作为默认模型,GPT-5.5 Instant首要提升了准确性和减少了“幻觉”(编造事实)[5] - 在医疗、法律和金融等高风险提示中,产生的虚假陈述减少了52.5% [5] - 在用户之前已标记为存在事实错误的棘手对话中,不准确陈述减少了37.3% [6] - 在多项基准测试中表现提升:在AIME 2025数学测试中准确率从65.4%升至81.2% [15];在GPQA(博士水平科学推理)测试中准确率从78.5%提升至85.6% [16];在解读科学图表的CharXiv测试中准确率从75.0%提升至81.6% [18];在MMMU-Pro(处理文本和图像专家级问题)测试中准确率从69.2%提升至76.0% [19];在OmniDocBench(从复杂文档提取数据)测试中错误率从14.6%下降至12.5% [21] 交互风格优化:简洁与聚焦 - 模型回答风格核心变化是更短更聚焦,但不丢失实质信息 [25] - 减少了过度格式化、不必要的追问以及不必要的表情符号 [27] - 在一个示例中,GPT-5.5 Instant使用的单词数减少了30.2%,行数减少了29.2% [29] - 回答语气把握恰当:非正式、实用且符合职场规范,避免了过度解释 [30] - 回答能针对不同情况提供可用方案,并且对事不对人 [31] 新功能:记忆与上下文理解 - 模型引入了“记忆来源”功能,会向用户显示哪些过去的记忆(如连接的邮箱、历史对话、上传的文件)影响了本次回复 [8][34] - 关键改进在于模型能判断何时使用这些上下文能让回答更好,而不是每次都硬套记忆 [33] 升级意义与目标用户 - 此次升级对于默认模型意义重大,因为用户日常询问的问题多涉及合同、报销、病症解释、代码报错、作业思路等实用场景 [13] - 在这些场景中,模型一本正经地讲错话比“不会”更麻烦 [14] - OpenAI首席执行官奥特曼特别强调,如果用户最近只使用深度思考模型,不妨回来看看这个新默认模型 [4] 产品部署与过渡安排 - 旧模型GPT-5.3 Instant不会立刻消失,付费用户还能在模型配置里继续访问该模型三个月,之后才会退役 [39] - 个性化增强功能(如记忆)会先向Plus和Pro用户的网页端推出,移动端随后上线 [39] - Free、Go、Business、Enterprise等计划用户将在后续几周获得功能扩展 [39]
刚刚,ChatGPT免费模型升级了:幻觉砍半/记忆更强/回答更简洁
量子位·2026-05-06 08:08