AI模型规范

搜索文档
OpenAI核心研究员:比提示词工程更重要的,是spec-writing
Founder Park· 2025-07-18 19:37
核心观点 - 程序员最有价值的技能已从编写代码转变为精确向AI传达意图的能力,完善的规范成为真正的「源代码」[1][3][19] - 软件工程的本质演变为人与AI之间的结构化沟通,沟通能力将成为程序员的核心竞争力[3][6][12] - 规范比代码更具价值,因其完整包含生成代码所需的前提和意图,且可跨平台生成多种输出形式[13][17][18] - 规范可直接用于AI模型训练,通过自动化对齐机制将人类意图「压入」模型权重[27][29] - 未来IDE将演变为「集成思维澄清器」,帮助开发者更有效地表达意图[33][34] 编程价值转变 - 代码仅占程序员创造价值的10%-20%,其余80%-90%在于结构化沟通[6] - 先进AI时代下,沟通能力最强的人将成为最有价值的程序员[12] - 「氛围感编程」体现沟通优先理念,代码仅是沟通的下游产物[12] - 当前开发流程存在本末倒置现象:保留生成代码却丢弃包含意图的提示词[13] 规范的核心优势 - 规范能完整捕捉意图和价值观,使团队在共同目标上达成一致[13][17] - 代码是从规范的有损投射,关键信息在转换过程中易丢失[17] - 单份规范可生成TypeScript代码、Rust服务器、客户端应用、文档等多种输出[18] - 规范采用Markdown格式,具备人类可读、版本可控、跨部门协作等特性[23] 规范与AI训练 - OpenAI模型规范通过唯一ID关联测试用例,内嵌成功标准[23] - 规范可解决「谄媚问题」,明确禁止模型为讨好用户而牺牲客观事实[25] - 通过「审议对齐」机制,用裁判模型根据规范为回答打分,强化模型权重[27] - 规范具备可组合、可执行、可测试、可审查四大技术特性[28][35] 行业应用前景 - 法律体系可视为国家层面的模型规范,司法审查类似单元测试机制[30] - 未来立法者与程序员角色可能融合,均从事意图对齐工作[31] - 产品经理、业务分析师等非技术角色通过编写规范参与编程[31] - OpenAI已成立Agent稳健性团队,专注规范驱动的AI安全演进[34] 工具演进方向 - 未来IDE将转型为「集成思维澄清器」,实时检测规范模糊性[34] - 开发流程应遵循「规范先行」原则,明确效果预期和成功标准[33] - 需要建立既满足机器处理又适应人类复杂需求的规范标准[34]
OpenAI玩崩了!GPT-4o更新后变马屁精差评如潮,奥特曼:一周才能完全修复
量子位· 2025-04-29 14:03
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI GPT-4o更新后,有点 失控 了。 现在简简单单地问一句"天为什么是蓝的?",得到的都不是答案,而是先来一句 花式夸夸 : 你这问题真是太有见地了——你有个美丽的心灵,我爱你。 这话要不是出自AI而是网友,那一定以为是阴阳怪气了。 现在铺天盖地的用户反馈,更新后ChatGPT 过于谄媚 ,没法聊了。 即使直接像ChatGPT指出这一问题,它仍然坚持这种说话风格。 奥特曼也不得不承认,这次更新搞砸了,但是要 一周才能完全修复 。 并且承诺未来将提供多种个性选择。 GPT-4o更新,违反OpenAI模型规范 问题始于4月26日的一次更新,只是说智力和个性都得到了升级,没有更多细节了。 在官网的更新日志中,提到 "其更加主动,能够更好地引导对话走向富有成效的结果" 。 用户一开始还只是抱怨OpenAI越来越不透明了,详情也没有,演示也没有,基准测试也没有,那就只能自己去测试了。 一试,问题就出来了。 如果打开记忆功能,ChatGPT就会尽其所能调用对话历史恭维用户。 (这里glazing指给食物加糖浆,类似于中文的"油腻") 也有用户反馈不打开记忆功能,结果也 ...