Workflow
趋同进化(convergent evolution)
icon
搜索文档
Sakana让AI互相「猎杀」,而它们开始了趋同进化
机器之心· 2026-01-11 18:03
研究项目概述 - Sakana AI与MIT合作,提出名为“数字红皇后”的研究方法,利用大模型在经典编程游戏《Core War》中驱动一场自演化的“军备竞赛” [2][3] - 该方法通过在游戏中不断战斗来迭代代码演化,训练新“战士”对抗不断变化的对手,旨在生成既健壮又通用的程序 [3] - 研究将《Core War》定位为一个用于研究人工系统中红皇后动力学的实验沙盒,为分析AI智能体在现实世界对抗性环境中的演化提供了安全可控的环境 [7] 研究方法与机制 - 研究构建了一个动态的对抗演化环境,程序在其中不断适应、进化,以击败逐渐累积的对手历史,而非一组固定敌人 [7] - 具体算法从一个初始战士开始,进化出第二个战士击败第一个,再进化第三个战士对抗前两个,以此类推,产生一个战士世系,每个后代都适应于由其所有前代定义的不断变化的环境 [23] - 该算法是先前多智能体和自博弈方法的最小化实现,旨在隔离并研究持续协同进化的动态 [25] 核心发现与现象 - 研究发现,随着算法运行轮次增加,战士们逐渐变得更具通用稳健性,这通过与未见过的、由人类设计的战士对抗来衡量 [26] - 实验中观察到独立运行的多个实验会随时间推移,趋向于演化出具有相似行为的战士,这种趋同发生在“功能”而非“实现”层面 [27] - 这种“表型趋同”类似于生物学中的趋同进化,即相似的功能特征通过不同的机制独立进化了多次 [30][31] 研究意义与潜在应用 - 该研究揭示的“红皇后”动态及其引发的趋同进化现象,可能为研究对抗性军备竞赛的其他特性提供了一个极具潜力的实验环境 [34] - 像“数字红皇后”这样的算法,甚至有助于在系统部署到现实世界之前,实现自动化的红队测试 [34] - 该沙盒环境完全自成体系,所有程序都在一台使用人造语言的虚拟机器上运行,生成的任何内容都无法在沙盒外执行,提供了一个安全的环境来探索可能具有风险的对抗性动态 [34] - 研究表明,即便是最简单的自对弈循环,也能揭示出复杂且鲁棒的策略,这使得该方法成为探索其他竞争性多智能体仿真的有力候选方案 [35]