Workflow
Claude 4 核心成员:Agent RL,RLVR 新范式,Inference 算力瓶颈
海外独角兽·2025-05-28 20:14

编译:haozhen 编辑:Siqi 海外独角兽原创编译 转载请注明 Anthropic 在上周五发布了 Claude 4,这是目前最前沿的 Coding 模型,也是最强的 Agentic 模型,可 以连续编程 7 个小时。本文是对 Anthropic 两位核心研究员 Sholto Douglas 和 Trenton Bricken 最新访 谈的编译,其中,Sholto 专注于 RL scaling,Trenton 则在做机制可解释性的研究: • 2025 年在模型训练上,最大的变化是 RL 终于有效,只要有合适的反馈机制,模型就能达到专家级 人类的表现和可靠性; • 今年年底会出现可以替代初级程序员的 Agent,到明年这个时候软件工程类的 Agent 将会在实际任 务中创造价值; • 可验证奖励强化学习 RLVR 的范式已在编程和数学领域得到证明,因为这些领域很容易获得此类清 晰的信号; • 模型自我意识的发展关键在于 reward。因为模型会以某种方式追求 reward,而这种追求会深刻地影 响模型的"人格"和个性,最终带来自我意识; • 让 AI 获得诺贝尔奖比获普利策小说奖更容易,因为要让模型具备像 ...