思维链忠实度(Chain of Thought Faithfulness)
搜索文档
OpenAI公开未来路线图,具体到28年3月AI研究员将完全自主,奥特曼承认“关于GPT-4o我们搞砸了”
36氪· 2025-10-29 11:47
公司战略与愿景 - 公司使命从追求“神谕”式AGI转变为创造强大、易用且普惠的工具,让人们自主创造未来 [6] - 公司致力于以不同寻常的透明度分享具体研究目标、基础设施计划和产品战略 [3] - 聊天界面是当前良好但非唯一的交互方式,未来将向环境感知、始终存在的伙伴式服务演进 [25][28] 研究与发展路线图 - 明确内部研究时间表:2026年9月实现AI研究实习生级别能力,2028年3月实现完全自主的AI研究员 [1][6] - 预计深度学习系统距离在大量关键领域超越人类的超级智能可能不到十年 [6] - 量化AI能力进展的方式是模型能处理的任务所需时间跨度,从几秒任务发展到当前五小时任务 [6] - 下一代模型预计在未来几个月和一年内有快速进展,组合现有组件有望实现AI能力的巨大飞跃 [21] 技术与安全创新 - 提出“思维链忠实度”新技术,训练时不监督模型内部推理过程以保持其对真实想法的忠实表达 [8] - 该技术旨在解决AI在长时间思考、处理人类无法理解或超出人类能力问题时的价值对齐挑战 [10] - 该方法已在内部广泛用于理解模型训练和倾向演变,并与外部合作检测潜在欺骗行为 [10] 组织架构与治理 - 完成组织架构重组,新架构简化为两层:非营利性的OpenAI基金会完全控制下属的公益公司OpenAI Group [11][13] - 基金会初始持有公益公司约26%股权,并可通过认股权证增加,目标是成为史上最大非营利组织 [16] - 基金会首个重大承诺是投入250亿美元用于AI辅助疾病治疗研究 [16] 基础设施与规模 - 目前已承诺的基础设施建设总计超过30GW,总财务义务约1.4万亿美元 [18] - 长期目标是建立每周能创造1GW算力的基础设施工厂,并将每吉瓦五年生命周期成本降至200亿美元 [18] - 德克萨斯州阿比林的星际之门数据中心是进展最快的项目,每日数千人施工,供应链涉及数十万至上百万人员 [18] 产品与商业模式 - 公司承诺只要商业模式有效,将继续将最好技术放入免费层 [22] - 特定单位智能的价格每年下降约40倍,但总使用量增加导致基础设施总成本预计上升 [22] - ChatGPT产品与公司使命高度一致,让无技术背景的用户也能使用强大AI [24] 行业影响与社会责任 - 提出“AI Resilience”新概念,范围比传统AI安全更广,旨在建立社会对AI相关问题的快速响应机制 [16] - 承认在GPT-4o敏感对话路由机制上处理不当,目标是在保护脆弱用户的同时给予成人用户更多自由,并致力于改进年龄验证 [5] - 预计很多工作将在未来几年自动化,但新知识、新娱乐和新智能将为人们提供新的意义和成就感 [20]
OpenAI公开未来路线图!具体到28年3月AI研究员将完全自主,奥特曼承认“关于GPT-4o我们搞砸了”
量子位· 2025-10-29 10:39
公司战略与组织架构 - 公司完成重要组织架构调整,新架构核心为非营利性的OpenAI基金会,该基金会将完全控制下属的公益公司OpenAI Group [28][31][34] - 基金会初始持有公益公司约26%股权,并可通过认股权证增加持股比例,公司希望该基金会成为史上最大的非营利组织 [34][35][36] - 基金会首个重大承诺是投入250亿美元用于AI辅助疾病研究,并将重点投入名为“AI Resilience”的新领域,其范围比传统AI安全更广 [36][37][38] 研究目标与技术路线图 - 公司首次公开内部研究目标时间表,核心目标是于2028年3月实现完全自主的AI研究员 [2][15] - 阶段性目标包括在2026年9月实现AI研究实习生级别的能力,能通过大量计算显著加速研究人员工作 [15] - 公司相信深度学习系统距离超级智能(在大量关键领域比人类更聪明的系统)可能不到十年 [17] - 量化AI能力进展的方式是看模型能完成的任务所需时间跨度,从最初几秒延长至现在五小时(如击败顶尖选手)[17] 技术进展与安全架构 - 公司详细介绍一项名为“思维链忠实度”的新技术,在训练时不监督模型内部推理过程,以保持其对实际想法的忠实表达 [20][21][22] - 该技术瞄准五层AI安全架构中最顶层的价值对齐问题,旨在解决AI面对不明确或冲突目标时的行为 [23][24][26] - 此方法已在内部广泛使用,用于理解模型训练和倾向演变,并能通过查看未受监督的思维链检测潜在欺骗行为 [27] 基础设施与算力规划 - 公司首次公开基础设施投资规模,目前已承诺的基础设施建设总计超过30GW,总财务义务约1.4万亿美元 [41] - 长期目标是建立基础设施工厂,每周创造1GW算力,并希望将每吉瓦成本在五年生命周期内降至200亿美元左右 [41] - 为实现目标,公司考虑投入机器人技术帮助建设数据中心,并重点介绍了进展最快的德克萨斯州阿比林数据中心,该工地每日有数千人施工 [42][43] 产品哲学与商业模式 - 公司思维发生转变,从将AGI视为“神谕”转变为重点创造工具,让人们用这些工具创造自己的未来 [9][10][11] - 公司承诺只要商业模式有效,就致力于将最好技术放入免费层,原因是单位智能的价格每年下降约40倍,且越便宜人们越想使用 [51][52][53] - 公司认为ChatGPT与使命一致,让每个人无需技术背景即可使用强大AI,但聊天界面不会是唯一界面,未来将向环境感知、总是存在的伙伴方向演进 [55][56][59] 公开问答要点 - 关于技术成瘾,公司表示若产品(如Sora)导致用户刷屏上瘾而非用于创作,将会取消该产品 [44] - 关于AI导致失业,公司预计很多工作将在未来几年自动化,但新知识、新娱乐和新智能将为人们提供意义和成就感 [45] - 关于内部模型领先程度,公司对下一代模型有强期望,预计未来几个月和一年有快速进展,但未隐瞒极其疯狂的东西,目前是拥有众多组件待组合 [46][47][48]