MASLab

搜索文档
统一20+多智能体方法,MASLab震撼发布
机器之心· 2025-06-13 12:31
多智能体系统(MAS)研究进展 - OpenAI将「组织级」智能列为AGI最终目标,即AI能像组织般管理复杂流程和决策[1] - 近两年多智能体系统研究快速涌现,推动领域向该目标迈进[1] - 上海交大、牛津大学等10家机构联合推出首个统一的大模型多智能体系统代码库MASLab[2] MASLab核心功能 - 集成20种主流MAS方法,覆盖NeurIPS/ICLR等顶会成果,严格遵循原始实现[6][8] - 统一输入预处理、LLM配置和评估协议,确保横评公平性[8] - 结构化代码设计支持快速复现和二次开发,解决接口混乱问题[7][8] 多智能体系统性能评估 - 实验覆盖10余种基准(MATH/GPQA等)和8大模型(LLaMA-3.3/GPT-4o等)[11] - MAS-GPT在Llama-3.3-70B上取得63.6平均分,优于单智能体基线(58.9)[12] - Qwen-2.5-72B上最佳方法(MAS-GPT)较单智能体提升1.3分(63.4 vs 62.1)[12] 技术创新与社区建设 - 团队提出MASLab-ReAct新方法,在工具调用场景展现显著优势[16] - 实验证明评估协议差异会导致方法排名剧烈变动[17] - 发起MASWorks开源社区,计划在ICML 2025举办MAS专题研讨会[23][24]