论文Fresh Content Needs More Attention:Multi-funnel Fresh Content Recommendation
方案和系统都不复杂,但是很切合业务实际。
论文的贡献主要再一下几方面:
a.证明了冷启动的价值,包括:1.Corpus coverage is improved。2.A larger corpus is discovered by the users。3.Content providers are encouraged to upload more contents。4.More fresh content is consumed by the users with a minor impact on short-term user engagement。
b.提出新的冷启动评估指标和评估方式。评估指标不在专注传统的ctr,而是提出三个新指标:1.Daily Unique Impressed Contents at 𝐾(DUIC@K)。2.Fresh Content Dwell Time。3.Number of content receiving X (post bootstrapping) positive。评估方式方面,实验组和对照组不应该相互干扰。实际上现在工业界很多公司的ab试验系统再冷启动方面都有数据泄露问题,实验组推荐推荐链路上的上游数据会进入对照组的训练数据,实际上是一中数据泄露,会导致冷启动方案的收益低估。
整体冷启动的架构不复杂,整个推荐链条为:
新类容召回——内容过滤(graduation filter)——多臂老虎机预打分——精排
新类容召回包含两个召回模型 ,一个只用meta feature的双塔模型Low-funnel model,一个使用用户最近点击行为的实时双塔召回模型Middle-funnel model。线上按概率p随机使用Low-funnel model召回,1-p概率使用Middle-funnel model。
内容过滤(graduation filter) 按照次数过滤掉新内容召回的item,超过n次展示的内容会被过滤,实际上就是冷启动 cold-start阶段的频率控制,避免少数新内容占用过多曝光。
多臂老虎机预打分采用的是Thompson Sampling。论文中没有详细说怎么做的。实际上可以采用linucb或者 Contextual Thompson Sampling。预打分选取10个候选进精排。
精排部分,论文采用的是google 的主推荐rank 算法来确定top 1.