315晚会 网站建设公司今日实时热点新闻事件
0.召回方法
词召回
swing、itemCF
缺点:
- 有冷启动问题
- 不是全局召回,冷门活动难以得到召回结果
- 容易召回过多的头部热门活动
向量召回
参考文献:
经典推荐算法学习(七)| Graph Embedding技术学习 | 从DeepWalk到Node2vec、EGES | 附DeepWalk PySpark实现 - 知乎
经典推荐算法学习(十三)| 常见推荐召回算法梳理 - 知乎
- FM
- Item2vec
- Youtube向量召回
- Graph Embedding-EGES
- Airbnb向量召回
- 双塔召回
问题
1.如何评价召回测
(1)recall、precison、F1
(2)NS-recall、NS-precision、NS-F1:
(3)覆盖率:简单理解,覆盖率就是荐系统能够推荐出来的物品占总物品的比例。由于热门物品占据大量曝光,可能会让很多物品处于不被曝光的状态,这个就是长尾效应。覆盖率是对针对解决长尾效应的一个常用指标。
2.如何摸底召回的上限?
推荐系统中的召回模块决定着推荐效果的上限,那么怎么评价召回模块做好了呢? - 知乎
实际是问召回的评估方法,也可以用下列方法
(1)竟对评估,利用结果倒推召回测问题
(2)随机人工标注数据,从各大平台找到理想结果,然后,回退到召回阶段进行分析
3.召回后续TODO
参考文献:从二值检索到层次竞买图——让搜索广告关键词召回焕然新生
(1)多场景数据融合,比如将搜索和推荐数据进行融合
(2)由于深度学习有可解释性和结果可控性问题,召回通路需要以不同目标进行召回。不同目标的召回通道间,配额需要结合流量价值、用户意图倾向、系统算力等多方面因素进行动态分配,是一个结合更多下游策略来考虑的问题。
(3)我们欢欣鼓舞在各召回通道上迭代模型涨了离线Recall/Hitrate,往往因为指标辛普森悖论、通道间重叠、下游打分偏差等原因,无法为大盘带来明显的竞价集合与效果变化。因此未来关键词召回业务的着力点,将聚焦在全链路排序的目标一致性上。将搜索广告系统看作一个计算图,召回阶段作为最上游的“召回Op”,需要捕捉更多下游“预估Op”、“机制Op”反向传播的“梯度”来动态修正召回阶段的检索能力;扩展更多维度的算法评价指标,为下游供给多样性充分、广告主竞争相对平等的广告集合,为直通车业务的高质量发展添砖加瓦。
(4)召回阶段拟合精排阶段的顺序