文章核心观点 - OpenAI高管阐述了公司未来战略,核心是将GPT-5作为推动推理能力和Agentic行为成为主流的关键一步,并致力于实现“自动化研究员”的长期目标 [6][13][25] - 公司认为现有模型评估指标正趋近饱和,未来将重点关注模型在科学发现和经济相关领域取得实际进展的能力 [8][13][15] - 强化学习被强调为远未达到瓶颈的关键技术,其与语言模型的结合是重要突破点,公司预计相关工具和方法论将持续快速迭代 [16][17] 技术发展路线图 - GPT-5是公司策略重心转向默认提供推理和更多Agentic行为的重要标志,旨在整合此前GPT系列(即时响应)和o系列(推理)的不同模式 [6][7] - 未来技术发展的一个关键衡量指标是模型进行有效推理和取得进展的时间跨度,当前水平为1~5小时,公司下一步将专注于延长此时间跨度,提升模型的长期规划能力和记忆保持 [13][15] - 编程模型已取得显著进步,从解决八年级数学问题到在编码竞赛中达到人类水平仅用约一年时间,改变了默认的编码方式,下一代方向可能是“氛围研究” [19][21] 研究与评估方法演进 - 公司承认过去依赖的评估体系已接近饱和,早期通过大规模预训练评估泛化能力,现在则通过针对严肃推理的强化学习培养领域专家,但缺乏更合适的评估体系 [8] - 未来评估将不再局限于传统基准测试,而是转向模型能否发现新事物以及在具有经济相关性的领域取得实际进展 [8][13] - 编程竞赛被视为一个良好的封装测试环境,可用于衡量模型在受限环境和时间范围内提出新想法的能力 [18] 公司文化与人才策略 - 公司招人并非寻找“最出圈”或社交媒体上最引人注目的人,而是青睐那些具备坚持不懈特质、曾解决过难题、有扎实技术功底并愿意迎难而上的人才 [23][24] - 研究文化强调对假设保持清晰、对进展保持极度诚实,并保护基础研究不被短期产品竞争的节奏带偏,为研究员提供思考未来一两年重大问题的空间 [23][25] - 成功的秘诀在于专注于基础研究而非简单模仿竞争对手,公司通过清晰的研究目标和创新氛围来吸引和留住人才 [23] 资源分配与核心约束 - 若有10%的额外资源,公司明确会投向计算资源,认为计算仍是当前的决定性约束因素,而非数据或人员 [26][27] - 公司处于强烈的计算限制下,其研究路线主要基于长期信念而非短期市场反馈,并需考虑能源等物理约束 [27][28] - 公司预测机器人技术会在不久的将来成为主要焦点 [28]
OpenAI两位首席最新采访信息量好大,终极目标是“自动化研究员”,招人并非寻找“最出圈”的人
36氪·2025-09-26 20:15