一、威尔逊算法
在互联网内容领域或者电商领域的策略相关同学,一定都听过大名鼎鼎的威尔逊算法,但每当不了解技术的同学们看到算法两个字,就会望而生畏,其实这个算法背后的原理还是比较简单的,但前提是你得动得基本的统计学基础知识
威尔逊算法主要是基于用户评价行为的排序算法,通俗的说就是大家觉得这个好,就会排到前面,是基于用户选择和评价行为的一种算法,所以要排序的东西,不管是文章、商品或者评论等等,首先需要有用户评价的功能,即有好坏的投票数据,才适合用这个算法。
我们把一个回答下的每次赞踩都当作试一次随机试验,则满足如下条件
1、每次赞踩都是独立的,互不影响的
2、用户只有两种选择,赞或者踩
3、n次重复投票后,赞了k次,那么好评率就是k/n
以上三个条件刚好满足二项分布,那么二项分布的P就是我们要的好评率,那么通过二项分布的相关计算,可以预测这个回答的好评率的置信区间,选择置信区间下线值作为回答的好评率 P,每个回答根据P的大小进行排序。这样一来,排序的步骤就比较清晰了
第一步:计算每个回答的好评率p
第二步:计算每个回答的好评率的置信区间
第三部:根据置信区间的下限值,进行排名,这个值越大,排名越高
① 二项分布的p=k/n,好评率p=k/n k为好评的次数,n为评价的总次数
②二项分布的置信区间(未完待续)
二项分布的置信区间有多种计算公式,最常见的是"正态区间"(Normal approximation interval)。但是,它只适用于样本较多的情况(np > 5 且 n(1 − p) > 5),对于小样本,它的准确性很差。因此我们采用Z检验, ,其中,,则有
二、知乎策略
知乎最核心的功能就是他的问答功能,他是以生产者和消费者为核心的机制,如何让消费者快速浏览沉迷到优质内容中,如何让生产者得到激励持续玩下去,是需要考虑的两个重要的问题。这两个问题是相辅相成的,好的内容得到好的曝光,既满足了消费者,也满足了生产者的利益,使得社区生态得到良性循环,因此知乎的策略主旨就是“让优质的内容得到更多的曝光”。
那么如何让回答优质并得到更多的曝光,主要从两个方面考虑1、优质内容生产及筛选 2、曝光激励手段,以下为主要的点,每个点可扩展的运营 产品 及策略工作都可以有很多。
① 运营垂类专家大v的招募储备(招募优质生产者 @运营)
② 策略精准筛选优质内容及用户(主动发现优质生产者@策略pm),这块主要有机器模型自动识别、用户反馈行为筛选两类。
③ 单答案的rank曝光刺激、产生用户互动激励、激发优质用户归属感认同感(留住优质生产者,吸引浏览者转化)
④ 创造其他曝光推荐机会,如日报、热榜等(留住头部优质生产者,吸引浏览者转化)
⑤ 给更多的权益,除了主要的曝光,还可以分润激励、平台认可等(刺激优质内容生产)
知乎的rank策略,框架图如下,主要就是威尔逊得分,知乎对于优质的回答的定义,不是提问者说了算,也不是平台说了算,而是广大浏览用户说了算,所以采用威尔逊得分最合适