突破双塔

2024年4月19日修改
双塔有在线检索部署性能的优势,同时也存在一些问题:
正如之前提的,双塔分离的结构,导致用户交互简单,模型上限不高
两阶段目标不一致:双塔使用ANN based 召回范式,如LSH/HNSW等算法,本质是为了近似topk或者搜索最大内积而设计的,并不是直接优化user-item训练样本,索引构建和检索目标的优化方向不一致。
同时难以避免双塔版本不一致问题
在技术迭代上来说,我们需要探索一种复杂度相对更高,更接近全库计算的召回方式,以满足业务增长诉求下增强对于召回结果的可控性,比如对相关性、多样性、效率收益等的控制,从而在召回的有效物料的数量与质量上再上一个层级;以及在算力允许的情况下,与复杂度更高的打分模型进行可插拔式的组合。
从整体看召回,全部过程包括三个重要的模块:
1.
候选item的索引结构:如何对全库商品组织成特定的结构,加速检索过程
2.
user-item的打分模型:如何衡量u-i的相似度
3.
target item的检索算法:如何在索引结构中检索出打分最高的item集合
从这三个角度出发,有了多种突破双塔结构的探索。
附件不支持打印

加载失败,