Workflow
自主信息检索智能体
icon
搜索文档
阿里发布信息检索Agent,可自主上网查资料,GAIA基准超越GPT-4o | 模型&数据开源
量子位· 2025-06-27 12:40
不圆 发自 凹非寺 量子位 | 公众号 QbitAI Agent能"看懂网页", 像人类一样上网 ? 阿里发布 WebDancer ,就像它的名字一样,为"网络舞台"而生。 只要输入指令,它就可以帮你上网搜索、做攻略,实现自主信息检索代理和类似深度研究模型的推理。 传统模型只能按固定流程思考,而WebDancer作为一个端到端的自主信息搜索智能体,具备多步推理、工具使用和泛化能力。 WebDancer在GAIA和WebWalkerQA上分别取得了61.1%和54.6%的Pass@3分数,优于基线模型和部分开源框架。 模型和方法均 已开源 ,网友直呼想试: WebDancer的秘密武器 不同于其它的推理问答模型,WebDancer要像人类一样 思考、理解并操作 ,可不是一件简单的事情。 使用GAIA、WebWalkerQA和日常使用情况对WebDancer进行演示,可以看到,WebDancer能够执行多步骤和复杂推理的长期任务,例如 网页遍历、信息搜索和问答。 它的"秘密武器"是一种 四阶段训练范式 ,包括浏览数据构建、轨迹采样、针对有效冷启动的监督微调以及用于改进泛化能力的强化学习。 阿里开源了这个训练框架, ...