1. 商业目标
商业目标:“演出和电影”的“生产商和渠道分发商”。
商业模式:收取会员费。
技术价值:认为个性化和推荐技术每年给NetFlix节省10亿美金。
2. 关注指标
总体指标:0.65亿会员、每天1亿小时的观影时长,也就是平均每个人观影时长超过1个小时。
优化指标:新客存留率、老客流失率、老客存留率。
3. 推荐策略
整体来说,推荐需要把握很重要的两点:推荐结果+推荐理由。也就是找到觉得用户感兴趣的东西,而且要让用户明白为什么推荐给他。
3.1 Personalized Video Ranker:PVR
也就是我们常用的RTP。
3.2 Top-N Video Ranker
也就是热门视频,通常我们用做补足逻辑。
3.3 Trending Now
短暂的实时突发趋势,几分钟或者几天内的趋势。
3.4 Continue Watching
继续观看动作分解:1)接着观看,2)重看,3)不感兴趣。根据用户日志信息学习一个Continue Watching策略模型,将接着观看和重看的结果推荐给用户。
3.5 Video-Video Similarity
也就是看了又看,自解释性强。
3.6 Evidence
Netflix将推荐理由展示提高到了一个高度,使用一个evidence selection算法来进行UI展示,包括推荐展示文字和展示图片来吸引用户。
4. 多策略融合
在推荐系统里面,多策略需要融合是一个不争的事实,很多公司已经通过做多策略融合拿到了很好的效果。但是,多策略的融合问题至今为止一直没有一个公认的最优解法。如何在兼顾Recall、Precision和多样性(也是为了考虑Recall)的情况下将多个推荐策略融合在一起展示给用户。
参考文章:http://shiyanjun.cn/archives/1429.html
1. 加权的混合:用线性公式将几种不同的推荐按照一定权重组合起来,具体权重的值需要在测试数据集上反复试验,从而达到最好的推荐结果。
2. 切换的混合:其实对于不同的情况,推荐策略可能会有很大的不同,那么切换的混合方式,就是允许在不同的情况下,选择最为合适的推荐机制结果。
3. 分区的混合:采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户。
4. 分层的混合:采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐。
在这篇文章里面,Netflix自己号称多年磨一剑,找到了一个Page Generation的算法。该算法自动的生成推荐页面,并且考虑推荐结果和用户的相关性以及整个页面的多样性,并且已经在2015年度完成了上线。
Page Generation算法内容且听下回分解。
http://techblog.netflix.com/2015_04_01_archive.html
5. 尚未解决的技术问题
Presentation Bias
会员冷启动问题
会员账号共享问题
Evidence Selection算法还不够好。
6. 其他有意思的点
在Netflix系统里面,推荐流量占比达到80%,而搜索仅占了20%。甚至,在搜索流量下也会出推荐结果,放在搜索展示结果后面供用户选择。
A/B测试时,会区分老客和新客分别做。因为考虑到老客对已有系统的习惯可能会抵触,而新客却没有这个问题,所以他们更加倾向于使用新客来做实验。但是,因为新客的数量和日志质量问题,新客的实验结果可能会存在统计意义上的问题。