效果、性能双突破,快手OneSug端到端生成式框架入选AAAI 2026
快手快手(HK:01024) 机器之心·2026-01-19 09:27

研究背景与问题 - 查询推荐是现代电商搜索系统的关键功能,旨在通过实时推荐相关查询帮助用户明确意图,提升搜索体验与转化效率 [2] - 传统方法通常采用多阶段级联架构,在效率与效果间取得平衡,但存在各阶段目标不一致、长尾查询召回困难等问题,限制了系统性能的进一步突破 [2][6] - 现有生成式检索方法多聚焦于视频推荐,其任务本质难以直接应用于输入输出均为开放词表的电商查询推荐场景 [7] 解决方案:OneSug框架 - 公司首次提出端到端的生成式统一查询推荐框架OneSug,将召回、粗排、精排等多个阶段统一在一个生成模型中 [2] - 框架包含三大核心模块:Prefix-Query表征增强模块、统一的Enc-Dec生成架构、用户行为偏好对齐 [8][9] - Prefix-Query表征增强模块旨在解决用户输入前缀较短且意图模糊的问题,通过语义与业务空间对齐及层次化语义ID生成来增强表征 [10][14] - 统一的Enc-Dec生成架构基于编码器-解码器结构,以自回归方式直接生成用户最可能点击的Query [11] - 用户行为偏好对齐模块通过奖励加权偏好优化和混合排序框架,精细化地对齐用户行为偏好,克服了传统方法的局限性 [13][16] 模型效果与性能 - 在快手电商场景的大规模数据集上,OneSug在HR@16和MRR@16指标上显著优于传统多阶段系统与生成式基线模型 [19] - 具体离线指标显示,OneSug模型效果随模型规模提升而增强,例如OneSugQwen2.5–3B模型在Click任务上的HR@16达到93.37%,MRR达到66.31% [20] - 在线AB实验中,OneSug大幅度提高了业务指标,例如List-wise版本使CTR提升2.01%,订单量提升2.04%,收入提升1.69% [21][22] - 在人工测评指标上,OneSugQwen2.5–0.5B使查询好评率提升32.50%,页面好评率提升18.35% [24] - 线上推理流程完全取代了传统多阶段架构,使平均耗时降低43.2% [25][26] 行业意义与未来展望 - OneSug是业界首个在电商场景中实现全流量部署的端到端生成式Query推荐系统,其统一建模方式显著提升了语义理解与个性化推荐能力 [26] - 该框架为生成式模型在搜索、广告、推荐等领域的落地提供了新范式 [26] - 未来公司将进一步探索大语言模型在排序阶段的强化学习优化、实时更新等方向,推动端到端生成式系统在多业务场景中的广泛应用 [27]