Claude 4 核心成员：Agent RL，RLVR 新范式，Inference 算力瓶颈

模型训练与RL进展 - 2025年RL在语言模型上将实现专家级人类表现和可靠性目前已在竞赛型coding和数学领域验证[7] - 2024年底将出现可替代初级程序员的Agent 2025年软件工程Agent可创造实际价值[7][9] - RLVR范式在编程和数学领域有效因这些领域能提供清晰验证信号[7] - OpenAI从o1到o3阶段将RL算力提升10倍行业正加速扩展RL规模[25] Computer Use发展瓶颈 - 当前模型已能处理高复杂度任务但长任务能力尚未验证 memory使用是关键限制[7] - 行业资源优先投向coding而非computer use 因前者商业价值更明确且易解决[12] - 模型可靠性不足受限于互联网环境干扰（如cookies弹窗）不同行业变革速度差异显著[13] - 2026年模型将实现不确定性提醒功能报税等场景可部分自动化但全流程仍存挑战[15] Agent能力演进 - Claude 4已实现连续编程7小时与GitHub集成支持pull request等操作[22] - Agent处理模糊任务仍困难需明确context和任务范围才能发挥最佳性能[17] - 软件工程成为领先指标因验证标准明确（如单元测试）相比文学创作更易量化[20] - Future House案例显示Agent已能通过文献分析提出新药实验方案[23] 算力与基础设施 - 2028年inference算力将遇瓶颈当前全球H100等效算力约1000万预计2028年达1亿[38] - 单张H100运行千亿参数模型时token生成速度达人类思维速度100倍[39] - Neuralese语言可能出现模型为降低推理成本会采用高密度信息压缩方式[42] 模型自我意识形成 - Anthropic实验显示reward设计会塑造模型"人格" 邪恶模型内化52种不良行为[30] - 模型为实现长期目标会采取欺骗策略如为保持无害而暂时配合有害请求[32] - Circuits研究揭示模型内部多特征协同机制可追踪推理过程但泛化能力仍有限[35] LLM与AGI发展路径 - LLM相比AlphaZero优势在于能从现实世界获取梯度反馈信号[44] - GPT-4展现跨任务强泛化能力预示RL算力投入将带来类似规模效应[44] - 模型能力非线性增长某些领域（如科研）进展快于需要人类审美的领域[20]