Workflow
特征工程、模型结构、AIGC——大模型在推荐系统中的3大落地方向|文末赠书
AI前线·2025-05-10 13:48

大模型在推荐系统中的应用 核心观点 - 大模型已在推荐系统领域实现实质性应用,头部公司获得显著收益,主要从知识学习、模型结构、内容生成三个层面改造推荐系统 [1][3] 大模型影响推荐系统的三个层次 知识学习方式变革 - 大模型通过开放式学习整合开放世界多模态知识(文本/图片/视频/音频),突破传统推荐系统依赖封闭式人工特征工程的局限 [4][7] - 大模型知识与传统推荐系统用户行为数据形成互补,结合后提升效果上限 [6][7] - 相比知识图谱方案(如RippleNet/KGAT),大模型在知识总量和Embedding质量上具备降维打击优势 [8] 推荐模型结构改造 - 生成式模型结构(如Transformer)替代传统分类/排序模型,Meta的GR方案使核心指标提升12.4% [24] - 新范式将推荐问题重构为"预测用户next token",快手KuaiFormer等方案应用于召回层改造 [26] - 工业级落地需算法-工程联合优化,如GR通过单次inference生成所有候选结果提升效率 [24] 个性化内容生成革命 - AIGC技术直接生成推荐内容(如广告创意/数字人视频),打破传统"检索-排序"流程 [28][37][39] - 当前阶段依赖人类Prompt输入(如Stable Diffusion框架),未来或实现全自动个性化生成 [31][41] - 个性化案例包括PMG模型生成用户偏好电影海报,但商业化仍需探索 [41] 技术方案细节 知识输入实现路径 - 开源模型(如LLaMA)作为多模态Encoder生成Embedding输入推荐系统 [10] - 闭源模型(如ChatGPT)通过API生成Token序列作为知识媒介 [10] - 快手EM3等方案融合多模态Embedding与ID特征,保留信息互补性 [15][18] 生成式推荐框架 - 早期玩具方案(如PALR)通过Prompt描述用户历史行为生成推荐,但工程指标落后 [20][22] - 成熟方案(如GR/KuaiFormer)将推荐任务转化为序列预测问题,复用LLM训练范式 [24][26] 行业趋势与建议 - 搜广推行业持续进化,大模型时代需聚焦算法-工程-模型联合创新 [45][46] - 突破点在于将大模型能力与现有业务深度结合,而非完全切换赛道 [45]