题目:内隐社交推荐的实验研究
作者大佬们:
摘要
近年来,由于社交网站的普遍存在,社会推荐问题引起了人们的广泛关注。前人的实验表明,社会信息对传统推荐算法的改进是非常有效的。然而,在大多数推荐系统中,并不总是可以获得明确的社会信息,这限制了社会推荐技术的进度。
本文研究了以下两个研究问题:(1)在一些没有显式社会信息的系统中,我们还能使用隐式社会信息来改进推荐系统吗?(2) 在具有显性社会信息的系统中,使用隐性社会信息的效果是否优于使用显性社会信息的表现?为了回答这两个问题,我们对三个推荐数据集进行了全面的实验分析。结果表明:(1)内隐用户和项目社交信息,包括相似和不相似的关系,可以用来改进传统的推荐方法。(2)在比较内隐社会信息与显性社会信息时,内隐信息的使用效果略差。这项研究为社会推荐技术提供了更多的见解,也大大扩大了以前和即将出现的社会推荐方法的效用和影响。
1、介绍
社会推荐方法的实质是利用用户的显性社会关系来提高推荐效果。然而,明确的社会联系信息并不总是可用的。在现实世界的推荐系统中,社会推荐数据是十分缺乏的缺乏,这极大地限制了社会推荐的影响和利用推荐方法。幸运的是,在我们没有明确的社会信息的情况下,我们总能为每个用户计算一组隐式社会信息。于是就引出了摘要中的那两个问题及解决方法。
2、相关工作
相关工作这里是说了两点:(1)传统的推荐系统,尤其是基于矩阵分解的推荐方法,(2)社会推荐方法。
第一点就不讲了,可以看看我的历史文章,下面就来讲讲社会推荐方法吧。
社会推荐方法
传统推荐技术都是基于用户项目评分矩阵,忽略了用户之间丰富的关系。最近,由于流行FWeb2.0社交网站,许多研究人员已经开始研究社交推荐系统。
由于每种方法的性质,社会推荐技术也可以分为两类:基于记忆的和基于模型的。
基于记忆的方法通常直接或间接地利用社会信任度来表示两个用户之间的相似性。有前人提出了一种基于信任感知的推荐系统方法。在本工作中,协作过滤过程被用户的信誉所取代,而用户信誉是通过传播信任来计算的。计算信任度以替换相似值。在两个用户之间。对大型社会推荐数据集-epinions的实验表明,这项工作增加了覆盖范围(可预测的评级数量),而不降低ACC错误(预测错误)。有前人提出了两种信任感知方法来改进标准协同过滤方法。实验结果表明,用户信任信息有助于提高推荐质量。
最近,利用矩阵分解框架的有效性和效率,提出了几种新的基于模型的方法来增强传统的矩阵因式分解。整合用户社会信息的方法。有前人提出了用户社会正则约束矩阵分解目标函数的两种社会正则化方法化条件。与以往的方法不同,本文提出的方法具有很强的通用性,不仅适用于用户信任关系,而且对用户社交朋友关系也有较好的效果。T型实验分析表明,所提出的框架优于其他最先进的方法.
3、矩阵分解
此文综述了一种流行的矩阵分解方法,该方法在文献中得到了广泛的研究。
考虑矩阵
描述
个用户对
个项目的评分,低秩矩阵因式分解方法试图用
阶因子
逼近频率矩阵R。现实世界中的矩阵R通常是非常稀疏的,因为大多数用户只访问了少数几个网站。
传统上采用正则化奇异值分解(RSVD)方法对矩阵进行极小化估计。
其中和
是
维的列向量。
是指示函数,当其等于
时等同于用户
评分项目
为0,而
表示正则化参数。上式的优化问题使具有二次正则化项的平方误差和目标函数最小化。
通过采用简单的随机梯度下降技术,对于每个观察到的,我们有以下有效的更新规则来学习潜在变量
:
其中是学习率。
在此部分引入的正则化SVD算法既有效又有效地解决了协同过滤问题,可能是协作中最流行的方法之一。
4、整合隐性社会信息
4.1 用户社会信息正则化
利用隐含的用户社会信息、不同的用户和项目的社会信息。然后,我们可以设计以下集成考虑到所有可能有益于推荐系统的信息的ED模型:
其中和
是正则化参数,
指示用户
和用户
之间的相似性,
表示用户
的朋友。
在文献中有几种方法可以用来比较两个用户之间的相似性。在此文中,采用了最流行的Pearson相关系数(PCC),被定义为:
其中是被用户
的评分物品,
是用户
的平均评估。
范围在
之间,越大越相似。
在此方法中,利用社交网络信息设计社交正则化术语来约束矩阵分解目标函数。更具体地,如果用户具有朋友
并且用户
具有朋友用户
,则该正则化项实际上间接地最小化了
和
的距离。
社会推荐方法的本质在于每个用户的社会信息。然后,可以利用这些社交朋友的信息来建立用户的模型。更准确地说。在缺少显式社会信息的情况下,我们总是可以计算另一组类似的Top-N用户,然后将那些类似的用户插入上述的社会推荐矩阵分解框架中。
4.2 不相似用户
到目前为止,我们只考虑利用相似的用户来改进推荐系统。如果两个用户相似,则是相对较大的值。
在相似用户的激励下,如果我们还包括最不相似的用户,我们实际上可以赋予社会正则化公式更多的建模能力。如果用户与用户
不同,我们想要的是使
和
之间的距离更大,或者换句话说,最大化它们之间的距离。事实上,我们可以令
来达到这个目的。因此,在这种情况下,社会正则化
实际将
和
之间的距离变大。
在本文中,除了Top-N相似用户外,我们还包括每个用户的Top-N不同用户。这不会改变方程中提到的目标函数。它只会增加集合中指定的隐式社会邻居的大小,并改变不同用户的相似值的符号。
4.3 物品社会关系
在原有的社会推荐问题中,由于通常社会网络只指人与人之间的社会关系,用户之间只有社会关系。在此文中,由于我们将隐性用户社会信息定义为相似或不同的用户,因此我们可以自然地扩展这一思想,以利用隐性项目社会信息的优势。可以通过相似或不同的物品找到。
目标函数如下:
其中表示物品
隐含的社会信息。
物品之间的相似度如下:
其中表示对物品
评分的用户。
同样,我们有以下更新规则来学习潜在参数:
4.4 联合模型
联合用户与物品正则化公式后,公式如下:
对于每个观察到的,我们有以下随机更新规则来了解所有潜在参数:
统一模型受四种信息的约束:相似用户正则化、不相似用户正则化、相似物品正则化和不相似物品正则化。我们使用上述信息有助于更好地塑造用户和物品的潜在空间,从而生成更准确的推荐结果。