在发声门槛越来越低的时代,当一个事件发生后,权威新闻源、多方评论、用户评论转载等内容迅速涌现了出来。有太多的蹭热点的内容,翻来覆去却了无新意,也许你会厌恶列表页上千篇一律的标题,也许你会被耸人听闻的标题所骗,点击后却怒发冲冠拍案而起。
重复,对于内容推荐来说,是一个必须解决的问题。
提前预警,以下是一个产品的絮叨,看官可以一脸嫌弃的走了。
孔乙己显出极高兴的样子,将两个指头的长指甲敲着柜台,点头说,“对呀对呀!…… 回字有四样写法,你知道么?”我愈不耐烦了,努着嘴走远。
将用户对于内容消费拆解为:列表页消费(点击前的消费预判)、详情页消费(点击后的消费体验),只在这两个维度拆分,就能够得到一张2x2的表格如下:
列表页相同 | 列表页不同 | |
---|---|---|
详情页相同 | A | B |
详情页不同 | C | D |
情况D是最简单的,两篇完全不同的内容,分别推荐即可。
情况A(甲乙两篇文章,列表页和详情页都相同):
搬运或作者重复发表、作者直接转发已发布内容等。这样的内容对于用户来说,是没有在列表页二次消费价值的,直接通过机器判断去重即可。
对于有重复消费需求的内容,如音乐、工具类内容,可以通过产品设计上的历史记录(再看一次)、收藏列表等方式处理。
情况B(甲乙两篇文章,列表页不同但详情页相同):
搬运或转载,同样一篇内容被以不同的妆容展现在列表页当中。这时,就涉及进一步的分析,用户是否看过。
如果用户点击过了甲文章,那么乙文章推荐给他的必要性是不大的,在点击后的消费体验是不大的;如果用户没有点击过甲文章,那么乙文章因为发布者、标题、封面的不同,带给用户的列表页消费体验是不一样的,故而有进一步推荐的必要性。头条号的脑洞功能“双标题+双封面”就是一个实际的应用。
情况C(甲乙两篇文章,列表页相同但详情页不同):
典型的case是如红烧肉的做法、郭德纲最新爆笑相声等,尽管用户点击后的消费体验不同,但是相似的列表页展示会给用户带来消费决策上的困惑。
如果用户点击过了甲文章,他十有八九会以为乙文章是重复内容,从而忽略;如果用户在列表页看过了但是没有点击甲文章,他也会大概率的错过乙文章。对于这样的情况,应该拉长两篇文章间的推荐间隔,将其视作一个密集打散问题处理。
如上
孔乙己刚用指甲蘸了酒,想在柜上写字,见我毫不热心,便又叹一口气,显出极惋惜的样子。