Workflow
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
量子位·2025-10-20 11:46

鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 在某种程度上,GPT-5可以被视作是o3.1。 该观点出自OpenAI研究副总裁 Jerry Tworek 的首次播客采访,而Jerry其人,正是 o1 模型的主导者之一。 在他看来,相比GPT-4, GPT-5更像是o3的迭代 ,而OpenAI接下来要做的,就是再创造一个"o3奇迹"——构建能力更强、思考时间更长、 能自主与多系统互动的模型。 在长达一小时的访谈中,Jerry Tworek侃侃而谈自己对GPT系列模型的思考。 从o1到GPT-5的模型演变历程讲起,介绍OpenAI的模型推理过程、公司内部架构、强化学习对OpenAI的意义,中间还穿插了他个人进入 OpenAI的经历,以及对OpenAI未来走向AGI的想法。 如果向10年前的人展示今天的ChatGPT,他们可能会称之为AGI。 另外,他也着重肯定了 DeepSeek 提出的GRPO算法贡献,推动了美国RL研究。 有趣的是,当他谈及自己也是 ChatGPT的重度"发烧友" ,每月都会花200美元充值在上面时,网友发现了华点: 万万没想到,OpenAI自家员工也要为ChatGPT付费。(doge ...