提出问题
近来在继续深化插件,打算做一些有趣的东西来。
然后,其中有一个问题,和统计学有点关系,正好今天在搞。
问题本身是这样的:
倘若,人对事物的喜好是可以被量化的,喜好度为0到1之间的一个实数,记为p。
接着,假定一个物体本身具有一个特定的“好感度”,记为q。
如果q比p大,那么这个人就会喜欢这样东西,从而给点赞。
那么,如果有N个人,面对一个物体,大概会有多少人为这个物体点赞?
这个问题当然可以推广,比如将上述的“物体”推广为文章,于是这就成了一篇文章会有多少人点赞的问题了。
为了解决这个问题,我们需要对这个情景做一个简单的建模。
回答
一个社群有N个人,这N个人对某个事物的喜好程度会是怎么个分布?
有可能是随机分布,不过个人认为更可能的是β分布。
如果是随机分布,那么这N个人对特定事物的喜好或者说审美品位就是在0到1之间等概率密度的分布,从而平均下来是0.5——这也就是说,如果这个物体的萌度或者说格调为q,那么这N个人中任意一个人喜欢它的概率都将是q,因为随机分布下,一个随机数有q的概率小于q。
这样,整个分布就是概率为q的二项式分布:
很显然,现在这样东西如果本身格调高,那么就会收到更多的点赞;如果本身格调低,那么收到的点赞就少。
这个现象很好。
可,如果是β分布,那这个情况就比较复杂了。
我们首先就要解决在β分布下,一个人喜欢这样东西的概率有多少。
β分布密度是这样的:
取这种形式,我们可以很简单地证明,这个分布的平均值也就是这个群体的平均品位值,就是ρ0,而其方差则正好就是δ。
那么,在这种分布下一个人会喜欢一个格调值为q的东西的概率有多大呢?答案是这样的:
其中
对这个公式,大概大家应该没什么概念,我们来看一下它的分布图吧:
这是ρ0=0.2,δ=0.01时的曲线,其中蓝色的是概率密度分布,红色的是概率分布。当q=0.8时,这个群体里的一个人会喜欢这样东西的概率为接近100%,q=0.5时的概率为99.35%,q=0.3时的概率为83.92%,q=0.2时为55.19%。
反过来,当ρ0=0.8,δ=0.01时,曲线是这样的:
此时,q=0.8时的概率为44.81%,q=0.5时的概率为0.65%,q=0.2时几乎不可能喜欢这样东西。
事实上,分析之后发现一件有趣的事情——
假定一样东西的格调符合这个社群的平均品位,那么这个社群的平均品位越高,这里的东西被喜欢的概率越低。反之,社群品位越低,对同品位的东西送上赞的概率越高。
从这点来看,点赞多似乎真不说明什么。。。
而,有了上述概率后,接下来点赞的情况就是一个简单的二项式分布,没啥好说的了。
至于说,如何利用海量的N和n数据来还原出q和ρ0,这个就再议了。
耶,东西写完,收工睡觉~~~
如果你觉得这篇东西写得还行,愿意打赏我一口咖啡,请戳打赏页~~
本文遵守创作共享CC BY-NC-SA 3.0协议**