智能体(Agentic RecSys)
搜索文档
下一代推荐系统长这样,Meta最新研究RecoWorld,从「猜你喜欢」到「听你指令」
机器之心· 2025-09-28 18:29
文章核心观点 - Meta提出RecoWorld作为推荐系统的新范式 通过模拟用户与智能体推荐系统的多轮交互实现从被动预测到主动互动的转变 旨在最大化用户留存率和参与度 [2][3][4][6][10][12][18][22][23] 传统推荐系统局限性 - 基于历史数据的离线评估容易导致路径依赖 使系统陷入老套路循环 [9] - 线上A/B测试虽能获取真实用户反馈 但存在损害用户体验的高风险 [10] RecoWorld核心架构 - 采用双视图架构:模拟用户会生成反思性指令 智能体推荐系统整合指令调整内容 形成动态反馈循环 [4][12] - 模拟用户操作包括点击、评论、分享、点赞、观看指定时长(以秒为单位)、跳过及离开会话 其中离开时会触发反思机制 [13][14] - 用户决策受环境因素影响:时间(一天中的时间、季节性)、人口统计(年龄、性别、位置)、行为(花费时间、搜索查询)和社会联系(团体关系) [14] - 会话从打开应用程序开始至退出结束 推荐列表从候选集选择并按顺序显示 目标优化长期留存指标(如会话时长和会话间隔) 关联每日活跃用户DAU [16] 多模态与多智能体支持 - 支持文本、多模态和语义ID建模 利用大语言模型推理能力模拟人类行为 [4][13] - 支持多用户和多群体交互场景 创作者可测试内容策略(如发布频率、争议话题影响) [18][24] 系统优化机制 - 通过多轮强化学习迭代完善策略 用户指令驱动推荐系统调整 形成"用户指令-系统响应"新范式 [4][18][22] - 模拟示例显示:用户对兴趣内容(如UFC Fight Night)观看30秒并点赞 对无关内容(如Hairstyling)选择跳过并更新心态期望减少推荐 [17] 行业意义与前景 - 作为推荐系统研究的基础设施 类似OpenAI Gym之于强化学习 提供安全试验场用于算法测试和模型对比 [21] - 推动推荐系统从单向推送向双向互动演进 从"算法支配用户"转向"用户指挥算法" 成为可对话的数字伙伴 [22][23] - 潜在应用:降低研发试错成本 为创作者提供内容风洞测试 为用户提供更智能的个性化推荐(如根据学习进度推荐练习曲、感知疲劳推荐轻松内容) [24][25]