Workflow
人工超级智能(ASI)
icon
搜索文档
万字长文!首篇智能体自进化综述:迈向超级人工智能之路~
自动驾驶之心· 2025-08-01 07:33
自进化智能体综述核心观点 - 自进化智能体是AI领域从静态模型转向动态持续学习的关键范式转变 旨在解决LLMs在开放环境中无法实时调整参数的瓶颈问题 [2][3][5] - 研究围绕三大基础维度构建框架:进化对象(模型/记忆/工具/架构)、进化时机(测试时内/外)、进化机制(奖励/反馈/搜索等) [2][6][21] - 该领域首次系统性梳理了自进化智能体的算法、评估指标和应用场景 为人工超级智能(ASI)的实现提供路线图 [3][6][52] 进化对象(What to Evolve) - **模型进化**:通过参数微调(SFT/RL)实现推理和行为优化 如AgentGen支持策略网络动态更新 [22][24] - **记忆进化**:长期记忆模块(如Mem0)可存储历史交互数据 支持经验复用和知识迁移 [24][29] - **工具进化**:智能体自主创建/掌握新工具(如Voyager生成代码工具)以扩展能力边界 [24][42] - **架构进化**:单智能体向多智能体系统扩展(如MAS-Zero) 通过协作提升复杂任务处理能力 [24][159] 进化时机(When to Evolve) - **测试时内进化**:任务执行中实时调整(如通过ICL) 典型场景包括动态环境交互和即时错误修正 [25][26][27] - **测试时外进化**:任务间隙离线优化 含监督微调(SFT)和强化学习(RL)两种范式 需平衡计算成本与长期收益 [26][28][33] 进化机制(How to Evolve) - **奖励驱动**:利用标量奖励(如TextGrad)或自然语言反馈引导进化 需注意奖励稀疏性问题 [31][32][36] - **模仿学习**:通过高质量示范(人类/智能体生成)快速提升能力 但依赖数据多样性 [32][36] - **群体进化**:多智能体系统(如AlphaEvolve)采用选择/变异机制 促进策略创新但计算成本高 [32][36][61] 应用场景 - **通用领域**:编程(Voyager自动生成代码)、教育(个性化学习助手)等数字环境任务 [38][42] - **专业领域**:医疗(WIN-GPT电子病历分析)、科研(文献自动归纳与实验设计)等高专业性场景 [43][47] 未来挑战 - **个性化进化**:需解决冷启动问题 开发轻量级评估指标以跟踪长期用户偏好适应 [43][44] - **安全可控性**:构建"智能体宪法"框架 防止有害行为生成和隐私泄露 [49][50] - **多智能体协同**:平衡个体推理与群体决策 开发动态评估基准反映长期交互效应 [51]
OpenAI反挖四位特斯拉、xAI、Meta高级工程师,目标星际之门
机器之心· 2025-07-09 12:23
AI行业人才争夺战 - Meta近期从OpenAI挖走至少7位员工并提供高薪酬和充足算力资源 [8] - OpenAI从特斯拉、xAI和X公司挖来4位知名工程师包括特斯拉前软件工程副总裁David Lau [3][5] - 被Meta挖走的OpenAI研究者已达8位可能加入Meta新组建的超级智能实验室 [18] OpenAI的战略布局 - OpenAI扩展团队负责管理后端硬件与软件系统及数据中心包括"星际之门"超级计算机项目 [7] - "星际之门"计划将包含百万块专用AI芯片预计成本达1150亿美元 [7] - 公司强调基础设施对实现通用人工智能(AGI)使命的关键作用 [7] 行业竞争态势 - AI行业自2022年底ChatGPT推出后人才争夺战异常激烈 [13] - 各大公司为率先实现人工超级智能(ASI)重新反思常规人才招聘规范 [14][15] - 扩展能力(scaling)对AI发展起关键作用更多数据和算力使模型更强大 [16][17] 公司间关系动态 - OpenAI从xAI挖人可能加剧与马斯克的紧张关系 [10] - 马斯克2018年退出OpenAI后现正起诉公司背弃初衷 [11] - OpenAI反诉马斯克指控其存在不正当竞争并干扰公司运营 [12] 人才流动影响 - OpenAI首席研究官Mark Chen表示要在顶尖研究人才争夺战中与Meta正面交锋 [19] - 公司可能调整研究人员薪酬方案以更好应对竞争 [8] - Meta挖角目标还包括Thinking Machines Lab多位员工 [9]