1、背景介绍
近来,因为知识图谱(KG)中具有很多有关商品的属性信息,如电影的演员、主演等,常用于增加推荐系统的质量,而且相比于原来的只有user-item 交互信息的推荐,因为引入了额外的属性上信息,在一定程度上具有可解释性。
当前,可解释性推荐研究方向主要有两个:meta-path based 和 embedding based。其中meta-path based 方式需要手工制作特征,而这需要领域知识。与此不同的是,embedding based 方式通过学习KG中entity的属性表示,避免了这个问题。然而这个方法忽略了KG中实体对之间的relation的语义。举个例子:
本文作者提出了名为RKGE的模型,不仅学习到了path的语义表示,而且不需要使用领域知识。
2、模型定义
这里给出论文中使用的符号定义和KG的定义。需要说明的是:这里的entity包括(user,item和KG中实体)
3、模型框架
首先给出模型的整体架构图:
模型由三部分组成:
【1】Semantic Path Mining
为了充分的利用KG中实体关系,我们首先挖掘实体之间 具有不同的语义的路径,它可以直接作为后面RNN的输入。考虑到KG非常大和复杂,因此路径数量可能会非常多,因此我们定义两种策略:
Strategy 1. 我们仅仅考虑那些将user和它交互过的item连接起来的路径,这些路径对我们的推荐目的来说更有帮助。(此处理解不是很深刻)
Strategy 2. 定义一个阈值,我们只考虑长度小于这个阈值的路径,根据Sun et al.[1]的介绍,相对较短的路径已经可以很好的建模实体关系,而较长的路径因为引入了相对较远的邻居,反而会造成语义的损失,带来噪音。关于阈值的大小设定,作者在实验部分进行了测试。
【2】Recurrent Network Batch
作者采用RNN来编码这些path,因为path的数量是动态变化的,因此我们采用每一个path采用对应一个RNN的方式,为了避免过拟合,这些RNN共享同样的参数。
其中代表和之间的路径数量,代表第条路径。RNN网络可以学习到每一个item的表示和整个路径表示。这主要是通过两个部件来实现
Embedding Layer.
其中代表路径上第T个entity的embedding.将这个路径表示作为RNN的输入,我们可以学到一个表示整个路径语义的vector.
Attention-Gated Hidden Layer.
我们采用一个attention gate来控制path上信息的流动。
其中,表示在第t步的attention gate.W,H是线性转换参数。
而通过双向RNN来计算。
【3】Saliency Determination.
这里为了合并 不同path编码后的结果,我们采用一个pooling 操作,它致力于去找到不同向量最要的特征,论文中说之所以不采用注意力机制,是因为注意力机制一般是用来识别一个序列中不同元素的重要性,而我们的目的是为了区分不同路径的显著性。(个人认为有点牵强),具体计算方式见图,即取多个向量中每一维最大的那个值。
4、参数学习
将其视为二分类问题,最小化损失函数
五、实验部分
数据集采用IM-1M,Yelp
评价指标采用MRR,Prec.