一、书籍介绍
《推荐系统实践》项亮编著,陈义、王益审校,人民邮电出版社。
本篇读书笔记主要针对该书的第五章内容-利用上下文信息。
二、结构概览
三、主要内容
上下文(context)信息包括用户访问推荐系统的时间、地点、心情等。——用户当下所处的环境。比如说根据心情推歌。
1.时间上下文信息
(1)什么是时间效应
a)用户兴趣可能会随着时间不同而变化。
b)物品本身有生命周期。比如新闻的生命周期很短,音乐的生命周期很长。
c)季节效应:冬天吃火锅,夏天吃冰棍。
(2)系统时间特性的分析
添加时间上下文内容后,推荐系统从一个静态系统变成了一个时变的系统,用户行为数据也变成了时间序列,包含时间信息。
(3)推荐系统的实时性
实时的推荐系统要能够实时响应用户新的行为,当用户有所行为后,推荐列表不断变化,满足用户不断变化的兴趣。
如亚马逊:用户的显性反馈行为都会导致推荐列表的变化。
对推荐系统的要求:
a)对用户行为的存取具有实时性。
b)推荐算法本身具有实时性:实时计算推荐列表;算法需要平衡考虑用户的近期行为和长期行为。
(4)推荐算法的时间多样性
时间多样性高的推荐系统用户会经常在不同时间看到不同的结果。在不损失精度的情况下要提高推荐结果的时间多样性。
时间多样性的解决可以有两步:a)用户在有新行为后调整推荐结果,让结果满足用户最近的兴趣;b)用户没有新的行为也能够变化结果。
对于b),有几种思路。
*在生成推荐结果的过程中加入一定的随机性,随机挑选部分。
*对用户看到过的内容降权。
*每天使用不同的算法。
(5)算法
a)给用户推荐历史上最热门的物品
b)时间上下文相关的ItemCF算法
首先我们回顾一下ItemCF算法,主要是利用用户行为计算物品之间的相似度,然后根据推荐用户历史行为的物品中的相似物品。
增加时间信息后:
*用户在相隔很短的时间内喜欢的物品具有更高的相似度(针对物品之间相似度的计算)
*用户近期行为比用户很久之前的行为,更能体现用户现在的兴趣,优先给用户推荐近期行为相似的物品。
c)时间上下文相隔的UserCF算法
同样,UserCF算法是给用户推荐和她兴趣相似的其他用户喜欢的物品。
增加时间信息:
*不同用户在表达出对物品喜欢的时间距离越近,表明用户间的兴趣相似度更大。
*给用户推荐和他兴趣相似的用户最近喜欢的物品。因为时间越近,越能代表当下的兴趣。
(6)时间段图模型
在图模型中添加一个物品时间段节点集合和用户时间段节点集合。
2.地点上下文信息
不同地区,可能兴趣也会不同。
LARS的推荐系统:首先将物品分为有空间属性和没有空间属性的物品;其次,将用户也分为有空间属性(带有现在地址的)、没有空间属性的。由此将数据集分成带有空间属性的数据集。在地点上下文的推荐,可以考虑两个方面,第一,不同地方的用户兴趣存在者很大的差别,因此在推荐系统中要考虑用户的空间位置。第二,用户往往在附近的地区活动。因此不能给用户推荐太远的地方。
四、思考与总结
时间、地点可以认为是已经验证过的影响兴趣推荐的上下文信息。因此我们可以在已有的推荐算法中加入时间、地点的因素。对于一些未验证的因素,我们还需先验证,然后和已有的算法相结合。
延伸阅读: