推荐系统结构学习

推荐系统

参考书本：项亮, 推荐系统实践. 2012
本文系阅读笔记

推荐引擎架构

推荐引擎架构主要包括3部分。【具体看书，有图】
 该部分负责从数据库或者缓存中拿到用户行为数据，通过分析不同行为，生成当前用户的特征向量。不过如果是使用非行为特征，就不需要使用行为提取和分析模块了。该模块的输出是用户特征向量。
 该部分负责将用户的特征向量通过特征-物品相关矩阵转化为初始推荐物品列表。【大部分推荐算法关心的地方，填物品用户表得到推荐物品】（很多个相关表，得到特征-物品相关推荐）
 该部分负责对初始的推荐列表进行过滤、排名等处理，从而生成最终的推荐结果。

生成用户特征向量

用户行为种类，用户行为产生时间，用户行为次数，物品热门程度（对热门物品的喜爱不能很好地展示用户的个性，因为用户可能是在跟风）

特征-物品相关推荐

即使是协同过滤，也可以根据不同的用户行为数据得到不同的相关表。比如可以根据用户的打分行为计算论文之间的相关性，也可以根据用户的浏览行为计算论文之间的相关性。总之，对于一个推荐引擎可以在配置文件中配置很多相关表以及它们的权重，而在线服务在启动时会将这些相关表按照配置的权重相加，然后将最终的相关表保存在内存中，而在给用户进行推荐时，用的已经是加权后的相关表了。

过滤模块

一般来说，过滤模块会过滤掉以下物品。
 用户已经产生过行为物品因为推荐系统的目的是帮助用户发现物品，因此没必要给用户推荐他已经知道的物品，这样可以保证推荐结果的新颖性。
 候选物品以外的物品候选物品集合一般有两个来源，一个是产品需求。比如在首页可要求将新加入的物品推荐给用户，因此需要在过滤模块中过滤掉不满足这一条件的物品。另一个来源是用户自己的选择，比如用户选择了某一个价格区间，只希望看到这个价格区间内的物品，那么过滤模块需要过滤掉不满足用户需求的物品。
 某些质量很差的物品为了提高用户的体验，推荐系统需要给用户推荐质量好的物品，那么对于一些绝大多数用户评论都很差的物品，推荐系统需要过滤掉。这种过滤一般以用户的历史评分为依据，比如过滤掉平均分在2分以下的物品。

排名模块

经过过滤后的推荐结果直接展示给用户一般也没有问题，但如果对它们进行一些排名，则可以

推荐系统结构学习