一、前言
在推出《推荐系统系列之初识》、《推荐系统系列之基于人口统计学的推荐》、《推荐系统之基于物品内容的推荐》、《推荐系统系列之关联规则》、《推荐系统系列之协同过滤》以及《推荐系统系列之隐语义模型》这一系列推荐系统的主题文章后,现在我们要对这些常用的推荐算法进行对比总结。如果你对这些算法还不够熟悉,小编建议您浏览这几篇主题文章后再看下文。
二、推荐算法的对比
基于人口统计学的推荐 Vs. 基于用户的协同过滤
基于人口统计学的推荐和基于用户的协同过滤都是基于用户的相似度进行推荐的。不同的是,基于人口统计学的推荐度量用户的相似度时只考虑了用户本身的基本信息,比如性别、年龄等;而基于用户的协同过滤是基于用户对物品的历时偏好来度量用户的相似度的,该算法认为喜欢相似物品的用户有相似的偏好。
基于物品内容的推荐 Vs. 基于物品的协同过滤
基于物品内容的推荐和基于物品的协同过滤都是基于物品的相似度进行推荐的。不同的是,基于内容的推荐是基于物品本身的属性特征来衡量,没有考虑到用户对物品或内容的态度,而基于物品的协同过滤是从用户历史的偏好出发度量物品之间的相似性。
基于物品的协同过滤 Vs. 隐语义模型
基于物品的协同过滤算法支持很好的推荐解释,它可以利用用户的历史行为解释推荐结果。但隐语义模型无法提供这样的解释,它计算出的隐类虽然在语义上确实代表了一类兴趣和物品,却很难用自然语言描述并生成解释展现给用户。
三、推荐算法的组合应用
在实际应用中,一般不会只采用某一种推荐算法,而是将各个推荐算法进行组合。主要有以下几种方式:
加权的混合: 用线性公式将几种不同的推荐按照一定权重组合起来,具体权重的值需要在测试数据集上反复实验,从而达到最好的推荐效果;
切换的混合: 对于不同的情况(数据量,系统运行状况,用户和物品的数目等),推荐策略可能有很大的不同,切换的混合方式就是允许在不同的情况下,选择最为合适的推荐机制计算推荐;
分区的混合: 采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户。目前亚马逊、当当网等很多电子商务网站都是采用这样的方式;
分层的混合: 采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐;
四、结束语
以上就是这一系列的全部内容,可输入“推荐系统系列之”关键字进行搜索。