深度|OpenAI产品经理及后训练负责人:决定模型真正聪明程度的不是智能水平,而是它理解你的方式
Z Potentials·2026-01-16 15:59

GPT-5.1的核心升级:全面进入“推理时代” - 此次更新的核心目标是让所有聊天模型都成为“推理模型”,这是首次实现聊天中所有模型均为推理模型[5][6] - 模型引入了“思维链”机制,能够根据用户提示的复杂程度自主“决定要不要思考”以及思考的时长,从而优化答案并在必要时调用工具[7] - 此次更新是一个“模型系统”,而非单一模型,该系统包括一个推理模型、一个轻量推理模型、一个切换器模型以及一系列由其他模型驱动的工具[12] 针对GPT-5用户反馈的重大改进 - 针对用户反馈GPT-5“直觉更弱”和“不够温暖”的问题,团队从多个层面进行了调整,包括改进上下文窗口以携带更多用户历史信息,避免模型过快“忘记”重要内容[8] - 优化了GPT-5中引入的“自动切换器”,减少了聊天模型与推理模型之间因风格差异(如从情感安慰突然切换到临床分析)而造成的用户体验割裂感[9] - 大幅改进了“指令遵循”能力,使自定义指令的执行更稳定,模型能更好地记住用户的纠正和偏好[10] - 新增了“风格与特质”个性化功能,允许用户引导模型采用其偏好的表达方式,如简洁、冗长或使用表情符号等[10][15] 模型个性化与“人格”的构建 - 模型的“人格”被定义为整个用户体验的总和,不仅包括回应风格与语气,还包括UI、字体、响应速度、模型切换逻辑等所有产品元素[5][15][16] - 构建模型人格的难点在于平衡众多能力(如事实准确性、安全性)与保持“温暖”、“自然”的特质,需要在强化学习的奖励函数中进行艺术般的细微调整[16] - 个性化是未来智能的底层结构,目标是让模型因用户而改变,随着模型更智能,其可定制性也会越高,以满足超过八亿周活用户的多样化需求[3][22] 模型情商与记忆系统的演进 - 模型情商的提升与理解用户意图密切相关,涉及对用户历史、记忆和语境的综合理解[13] - 记忆功能使模型能够记录从对话中得知的关于用户的信息,并在未来的互动中使用,从而提供更贴合背景的回答,并支持如主动推送相关内容等“主动性特性”[25] - 高情商的模型需要正确携带上下文、记录记忆,并采用与用户相契合的表达风格,个性化功能正是为了增强这种“契合感”[13] 安全、可用性与创造力的平衡艺术 - 团队在模型安全与实用性之间寻求平衡,早期因过度担心滥用而导致模型拒绝过多请求,现在的目标是让模型既安全又有用[18] - 安全边界不是固定的,难点在于让模型学会理解复杂情境(如法律证据材料与私人邮件的区别)并找到适当的表达方式[19] - 模型在主观领域和创造力方面能力增强,能够表达不确定性,并在用户要求时在更大范围内调整写作风格(如“极其高雅”或“非常简单”)[20][21] 未来发展方向与用户体验建议 - 未来模型将更智能、更可定制,并且随着模型拥有更多用户记忆,能自动推断用户背景和需求,减少对复杂提示工程的依赖,但用户始终掌握主导权和透明度[24] - 建议用户用自己最熟悉、最有专业知识的难题去测试模型,以观察其进步,并鼓励持续尝试和探索[28] - 建议用户直接询问模型“我应该怎么写提示词?”,因为模型在帮助生成更好提示词方面已变得更强[29]