开放世界AI

搜索文档
ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式
机器之心· 2025-05-13 15:08
该工作由通用人工智能研究院 × 北京大学联手打造。第一作者郑欣悦为通用人工智能研究院研究员,共同一作为北京大学人工智能研究院博士生林昊苇, 通讯作者为北京大学助理教授梁一韬和通用人工智能研究院研究员郑子隆。 开发能在开放世界中完成多样任务的通用智能体,是 AI 领域的核心挑战。开放世界强调环境的动态性及任务的非预设性,智能体必须具备真正的泛化能力 才能稳健应对。然而,现有评测体系多受限于任务多样化不足、任务数量有限以及环境单一等因素,难以准确衡量智能体是否真正 「 理解 」 任务,或仅是 「 记住 」 了特定解法。 为此,我们构建了 Minecraft Universe ( MCU ) —— 一个面向通用智能体评测的生成式开放世界平台。 MCU 支持自动生成无限多样的任务配置,覆 盖丰富生态系统、复杂任务目标、天气变化等多种环境变量,旨在全面评估智能体的真实能力与泛化水平。该平台基于高效且功能全面的开发工具 MineStudio 构建,支持灵活定制环境设定,大规模数据集处理,并内置 VPTs 、 STEVE-1 等主流 Minecraft 智能体模型,显著简化评测流程,助力智 能体的快速迭代与发展。 开放世界 ...