输入“/”快速插入内容

KDD'23 | 美团Feed流推荐重排

2024年5月23日创建
美团feed流推荐端到端重排的工作,发表在KDD'23
在推荐系统中,重排位于精排之后,目的是充分利用上下文信息,对pointwise预估的精排结果进一步纠偏,提升最终展现效果。
在目前的重排模型研究中,大致可以分为两类
1.
Greedy贪心模型。通过RNN/GRU等方式一步一步贪心生成每个位置的最优候选,例如seq2slate、MIRNN、GRN等;缺点是忽略后续信息,仅考虑前位置对后位置的影响,难以获得最佳效果。
2.
Context-wise模型。又可以分为一阶段和两阶段:
a.
一阶段:输入精排候选list,在模型中引入上下文信息建模item间的相互影响,进而对item的ctr/cvr等进行重新预估,例如PRM、DLCM等。缺点是存在『evaluation-before-reranking』问题,即重排模型输入list的item顺序可能会影响最终list结果;
b.
两阶段:Generator-Evaluator通过generator阶段理论上可以生成所有可能的排列list候选,从而解决『evaluation-before-reranking』问题,但会出现复杂度过高无法上线的问题。例如PRS就通过beam-search来快速生成部分候选。
美团在这篇paper中采用G-E框架,对以下两个部分进行优化:
1.
此前基于启发式的两阶段方法,其生成阶段独立于评估阶段,评估结果不能指导生成过程。因此,对生成的候选排列的质量缺乏有效的判断。
2.
评估阶段的上下文感知要充足,商品可能有多个特征,用户可能对其中的某个特征(如价钱)感兴趣。
模型框架
提出两阶段PIER( Permutation-Level InterestBased End-to-End Re-ranking)的端到端重新排序框架,如下。
1.
输入所有待排序item集合
和 用户历史行为序列
,生成所有可能的候选list;
2.
通过 Fine-grained Permutation Selection Module (FPSM) 应用SimHash从全排列中快速的生成TOP-K集合;
3.
利用Omnidirectional Context-aware Prediction Module (OCPM)来为上一阶段的列表候选打分,选出最终胜出列表;
具体看下两个重要组件的细节