浅析豆瓣电影TOP250榜单——引言

豆瓣用户每天都在对“看过”的电影进行“很差”到“力荐”的评价,豆瓣根据每部影片看过的人数以及该影片所得的评价等综合数据,通过算法分析产生豆瓣电影250。

豆瓣网创始人兼CEO杨勃在知乎的豆瓣电影的分数和排序是怎么算出来的?一问中的回答如下:

豆瓣250里排序是综合分数和人数产生的,这个和IMDB总的想法类似。每一部电影的分数,确实主要是平均分数,但不简简单单是。因为偶然要和影托或者其他非正常个人意见PK,算法考虑了很多因素,包括时间和打分者自身的情况。细节不便公开,而且经常在细调。原则是尽算法范畴的所有能力去接近和还原普通观众最原汁原味的平均观影意见。有一个因素从来没有考虑过,就是商业合作。只要我在豆瓣,商业合作和分数不会有任何关系。

作者:杨勃 (阿北)
链接:https://www.zhihu.com/question/19627832/answer/12942692
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

作为一篇数据分析的文章,本文来探究一下其中所谓的算法的奥秘。

Jerome Yao
2017.07


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 这篇文章主要做了以下这些内容: 收集豆瓣电影排名榜单信息并加以处理成便于调用的文档形式。 分析榜单中影片相关的数据...
    JeromeYao阅读 1,835评论 0 0
  • 爱情,与我们而言,到底是什么? 有人说,爱情是生活的调味济,不是生活的全部,但却是不可或缺的。 有人说,爱情是神秘...
    陌药阅读 162评论 1 2
  • 你说你想要转变 找一个骇人的模板 照着血腥复刻另一个自己 这是谁?玛丽莲·曼森? 撒旦魔鬼的化身? 用磁性的嗓音敲...
    苍穹橙子阅读 194评论 5 4
  • 新晴投阔野,旧月近闲斋。 不胜玲珑意,徒飞寂寞腮。 西风裁妙引,北斗启心台。 尺素横生趣,频拾岭上白。 (中华新韵)
    文泳阅读 269评论 15 30