单个LLM已不够？华盛顿大学开源多模型协同框架MoCo

多模型协同研究趋势与愿景 - 研究趋势正从训练单一通用大语言模型转向关注多模型协同，即由不同群体、基于不同数据、以不同目的训练的多个大语言模型，通过多样化的协同算法与系统架构形成组合式人工智能系统 [2] - 多模型协同揭示了一种AI新未来的可能：由去中心化训练的多样化小模型通过协同算法构建模块化、组合式的AI系统，使得人人都能参与共建一种不为任何人单独所有的公共人工智能系统 [2] MoCo框架概述 - 华盛顿大学冯尚彬团队联合斯坦福大学、哈佛大学等研究人员提出了MoCo，一个针对多模型协同研究的Python框架，旨在支持研究并加速未来愿景的实现 [3] - MoCo支持26种在不同层级实现多模型交互的算法，研究者可以灵活自定义数据集、模型以及硬件配置，比较不同算法，优化自身算法，以此构建组合式人工智能系统 [3][6] - MoCo为设计、评估与分享新的模型协同算法、组合式智能以及协同开发策略提供了重要基础 [3] 多模型协同算法分类 - 多模型协同算法按模型间信息传递的层级主要分为四大类：API层级、文本层级、logit层级和权重层级 [5] - API层级协作将多个模型视为多个备选的API，根据不同任务与需求选择不同的模型，主要方法包括routing、cascading、switched generation等 [5] - 文本层级协作指多个模型通过生成文本的交互而协作，从而分工解决问题、优化模型输出，主要方法包括debate、feedback、response aggregation、structured interaction等 [5] - Logit层级协作指多个模型的next-token distribution之间进行代数运算，再根据共同的distribution进行decoding以生成文本，主要方法包括logit aggregation、contrast等 [5] - 权重层级协作指多个模型在权重空间进行信息传递与交互，以获得对当前任务更有效的新模型或系统，主要方法包括model merging、parameter arithmetic等 [5] MoCo框架功能与特点 - MoCo汇集众多模型协同研究者的力量，将分散在不同代码库中且使用不同框架的多样方法统合到一个框架与Python package中，解决了系统性研究与对比算法的阻碍 [10] - 使用MoCo非常简便：下载代码库或通过pip install modelco安装Python包，通过config文件设置参与协同的模型、目标数据集、硬件配置以及各类超参数，再通过一个命令就能执行从简单到复杂的各式协同算法 [10] - MoCo自带25个评估数据集，囊括问答、数学、推理、代码、安全等应用场景，用户也可轻松引入自己的评估数据集，或者仅用MoCo生成回答而另做评估 [12] - MoCo中的绝大部分算法采用了极为灵活的实现方式，支持任何数量的任何模型通过任何数量的常见GPU进行执行，从而使得小模型与少资源的研究场景也被充分支持 [12] 基于MoCo框架的研究发现 - 扩大模型协同系统的规模，将模型数量从2个扩充至16个，发现了普遍的向上趋势，这揭示了一种新的AI system的可能性，即很多小模块自底向上组成大系统 [13] - 在同等规模下，模型多样性具有重要作用：在模型数量均为8的情况下，8个多样的大语言模型协作显著优于8个同质的大语言模型协作，揭示了多个模型之间取长补短、互相成就的重要性 [13] - 多模型协作系统能够解决此前单一模型所不能解决的问题：在所有单一模型都不能解决的问题中，其协同系统平均能够解决18.5%的问题，揭示了模型协作在交互过程中涌现了单一模型所不具有的能力 [15]