提及个性化推荐,一个常见的误解是用户什么喜欢推荐什么,最终会将用户限制在信息茧房之中。
信息茧房其实关联了推荐领域的一个经典问题:Exploitation(利用已有兴趣推荐)和Exploration(探索新的兴趣)。推荐系统势必要在E&E之间取平衡和折衷。
推荐系统真的会把你陷入信息茧房么?
首先给出个人结论:探索是一个推荐系统必须做且需要做好的事情。如果推荐系统只推荐给你喜欢的内容,那其实说明它没有做的足够好。
下面慢慢絮叨原因。
站在利益角度,探索是必须的
其一,从用户产品来看,单个兴趣点的内容供给是不足够支撑用户停留时长的,并将进一步影响用户的留存。
以科技为例,一天的新闻、评论总数是有上限的,超过这个上限,内容质量必然得不到保证,从而影响用户的消费体验。只有尽量挖掘用户的兴趣点,才能够不断拓宽用户内容推荐的候选集合,实现推荐效果的最优化。
其二,从推荐效果来看,用户行为是另一种维度的资源。在User-Based的协同过程中,用户体量越大,越能够产出有密度的行为,才能够让内容的消费属性被更好的刻画。
其三,从商业化来看,也是较直观的判断。用户兴趣点越广泛,其可被推荐的广告内容才越多,变现价值才越高。
站在利益角度,探索的执行是有策略的
兴趣的探索过程,是一个完善用户画像的过程。
如前所述,只要是探索就会有损失,产品的职责就在于如何尽量降低这种探索损失。
首先,是从产品内和产品外划分。
探索发生在产品外部
用一切方式从产品外部补全用户信息,让用户在使用我们提供的服务时已经有相对丰富的画像信息。即,让用户的冷启动过程体验更好。
- 微博登陆是一个最常见的方式,通过采集微博的关注关系,有助于我们更好的理解一个账号。
- 邀请用户上传手机通讯录,用户的社会关系一定程度反映了用户本身。(在如今的微信年代,这种关系事实上变弱了)
- 其他……
其次,在产品内部从用户和内容的角度划分。
探索发生在用户耐受度更高的场景上
首先要明确的概念是:用户只有留存下来了,才有进一步探索的可能性。因此,要尽可能挑选那些用户耐受度更高的场景中应用探索,才符合产品的利益最大化。
比如,新老用户的划分,网络场景的划分、时间维度的划分等等。找到用户有耐性、有时间的场景里去做新兴趣点的探索,才能减少对时长的影响。
探索发生在更值得推荐的文章上
既然要进行探索,一个直观的判断就是选取那些具有类目代表性的,有一定质量的内容进行探索。
举一个场景,如果对于一个用户要推荐篮球的内容,自然应该选择推荐NBA类目下高质量的高热内容。NBA是篮球领域最具代表意义的赛事,高热和高质量能够让内容更具有消费性。
一个高质量的探索集合,能够保证用户即便看到了自己非感兴趣的内容,体验也相对可控。典型的应用例子如Yahoo Today Module:
Yahoo Today Module每天的Content Pool其实并不大。这里面都是网站编辑精选了的大概100篇文章。这些文章原本的质量就非常高。无论是这里面的任何一组,用户体验都没有明显变差。
或许,从终极意义上来说,每款产品都希望构建一个足以留住用户的信息茧房。我想,这样的茧房一定会大到用户感知不到。
有兴趣了解更多的,可以查看:
论推荐系统的Exploitation和Exploration