深度｜OpenAI产品经理及后训练负责人：决定模型真正聪明程度的不是智能水平，而是它理解你的方式

GPT-5.1的核心升级：全面进入“推理时代” - 此次更新的核心目标是让所有聊天模型都成为“推理模型”，这是首次实现聊天中所有模型均为推理模型[5][6] - 模型引入了“思维链”机制，能够根据用户提示的复杂程度自主“决定要不要思考”以及思考的时长，从而优化答案并在必要时调用工具[7] - 此次更新是一个“模型系统”，而非单一模型，该系统包括一个推理模型、一个轻量推理模型、一个切换器模型以及一系列由其他模型驱动的工具[12] 针对GPT-5用户反馈的重大改进 - 针对用户反馈GPT-5“直觉更弱”和“不够温暖”的问题，团队从多个层面进行了调整，包括改进上下文窗口以携带更多用户历史信息，避免模型过快“忘记”重要内容[8] - 优化了GPT-5中引入的“自动切换器”，减少了聊天模型与推理模型之间因风格差异（如从情感安慰突然切换到临床分析）而造成的用户体验割裂感[9] - 大幅改进了“指令遵循”能力，使自定义指令的执行更稳定，模型能更好地记住用户的纠正和偏好[10] - 新增了“风格与特质”个性化功能，允许用户引导模型采用其偏好的表达方式，如简洁、冗长或使用表情符号等[10][15] 模型个性化与“人格”的构建 - 模型的“人格”被定义为整个用户体验的总和，不仅包括回应风格与语气，还包括UI、字体、响应速度、模型切换逻辑等所有产品元素[5][15][16] - 构建模型人格的难点在于平衡众多能力（如事实准确性、安全性）与保持“温暖”、“自然”的特质，需要在强化学习的奖励函数中进行艺术般的细微调整[16] - 个性化是未来智能的底层结构，目标是让模型因用户而改变，随着模型更智能，其可定制性也会越高，以满足超过八亿周活用户的多样化需求[3][22] 模型情商与记忆系统的演进 - 模型情商的提升与理解用户意图密切相关，涉及对用户历史、记忆和语境的综合理解[13] - 记忆功能使模型能够记录从对话中得知的关于用户的信息，并在未来的互动中使用，从而提供更贴合背景的回答，并支持如主动推送相关内容等“主动性特性”[25] - 高情商的模型需要正确携带上下文、记录记忆，并采用与用户相契合的表达风格，个性化功能正是为了增强这种“契合感”[13] 安全、可用性与创造力的平衡艺术 - 团队在模型安全与实用性之间寻求平衡，早期因过度担心滥用而导致模型拒绝过多请求，现在的目标是让模型既安全又有用[18] - 安全边界不是固定的，难点在于让模型学会理解复杂情境（如法律证据材料与私人邮件的区别）并找到适当的表达方式[19] - 模型在主观领域和创造力方面能力增强，能够表达不确定性，并在用户要求时在更大范围内调整写作风格（如“极其高雅”或“非常简单”）[20][21] 未来发展方向与用户体验建议 - 未来模型将更智能、更可定制，并且随着模型拥有更多用户记忆，能自动推断用户背景和需求，减少对复杂提示工程的依赖，但用户始终掌握主导权和透明度[24] - 建议用户用自己最熟悉、最有专业知识的难题去测试模型，以观察其进步，并鼓励持续尝试和探索[28] - 建议用户直接询问模型“我应该怎么写提示词？”，因为模型在帮助生成更好提示词方面已变得更强[29]