首个完整开源的生成式推荐框架MiniOneRec,轻量复现工业级OneRec!
机器之心·2025-11-17 17:00

生成式推荐新范式概述 - 传统“召回+排序”级联式推荐架构收益触顶,生成式推荐成为行业热门话题[2] - 生成式推荐利用层次化语义ID表示用户历史序列,直接生成用户下一批可能交互的物品列表,显著提升模型智能上限并引入Scaling Law可能性[2] - 快手OneRec通过端到端推荐大模型实现资源可控且带来真实线上收益的推荐革命[2] MiniOneRec开源框架核心贡献 - 提供生成式推荐领域首个完整开源方案,实现全链路、一站式、端到端训练与研究平台[4] - 代码、数据集、模型权重全部开源,仅需4-8卡A100同级算力即可轻松复现[6] - 框架提供丰富SID Construction工具箱,集成RQ-VAE、RQ-Kmeans、RQ-VAE-v2等先进量化算法[9] 生成式推荐Scaling Law验证 - 在Amazon Review公开数据上训练从0.5B到7B的模型版本,验证模型规模增大时训练损失和评估损失持续下降[7][8] - 结果显示生成式推荐范式在参数利用效率上具有优势[8] 世界知识对推荐性能的影响 - 引入大模型世界知识能显著提升生成式推荐性能[13] - 基于预训练LLM初始化并进行语义对齐的MiniOneRec性能始终优于未对齐变体,表明通用序列处理能力和世界知识带来显著额外收益[15] - 框架将SID token添加至LLM词表,在SFT和RL阶段共同优化推荐与对齐任务[16] 面向推荐的强化学习优化 - 采用Constrained Beam-Search替代传统采样策略,高效生成多样化候选物品[21] - 在准确性奖励外引入排名奖励,对高置信度困难负样本施加额外惩罚以强化排序信号区分度[21] - 在同一Amazon基准上,MiniOneRec在HitRate@K和NDCG@K指标上全面领先传统推荐、生成式推荐及LLM推荐范式[22] 生成式推荐行业应用与展望 - 行业存在“改革派”与“革命派”两条路径:美团MTGR、淘天URM利用生成式架构能力进行增量改进;快手OneRec则颠覆传统方案实现端到端生成[25][26] - 生成式范式已在部分大厂走出可行性验证阶段,开始创造真实业务收益[27] - 生成式推荐展现出作为下一代推荐系统新范式的显著潜力[24]