DAGNN：基于需求感知图神经网络的会话推荐

发表于：sigir（2022）

摘要

大多数现有的方法都是为了直观地从匿名会话数据中发现潜在的兴趣或偏好，忽略了如何从会话中估计潜在需求。为了解决上述问题，本文提出了一种需求感知图神经网络（DAGNN）。设计了一个需求建模组件来首先提取会话需求，并使用全局需求矩阵估计每个会话的潜在多个需求。然后，设计了需求感知图神经网络来提取会话需求图，以学习DemandWare项嵌入，为以后的推荐提供依据。

Introduction

大多数基于会话的建议在技术上设计为首先探索隐藏在每个会话中的用户偏好，然后最好地匹配目标项目和提取的偏好之间的特征表示。然而，这些现有方法忽视了一个事实，即意图/目的或偏好/兴趣本质上是由用户的需求驱动的，即用户浏览或购买一组不同类别的项目的背后原因。因此，本文旨在明确地为推荐下一个项目的潜在需求建模。图1中绘制了一个示例，以澄清不同方法之间的差异。从这个图中可以清楚地看出，意图/目的是指用户想要购买的特定类别的物品。也就是说，用户清楚地知道要购买什么样的物品，例如沙发。出于这个目的，用户可能会有自己的喜好，如“浅色或深色”和“舒适或功能性”。然而，用户可能想要翻新他们的公寓，因此他们可能会购买沙发以及其他类别的物品。这些类别组合在一起，表示决定因素或不确定需求。显然，应该使用语义相关的多个意图/目的来建模此类需求。此外，需求项之间的订单依赖性是推荐的一个重要因素。例如，在“装修”需求下，用户在选择“浅色”地板后，倾向于购买“浅色”桌子。

项目的类别通常被建模为用户的意图。在一个特定的意图下，用户可能会有自己的个人品味，这被建模为偏好或兴趣。我们提出的需求是对不同数量的意图进行建模。例如，需求“装饰”包括沙发、桌子、窗帘等。

为此，我们通过线性变换矩阵将项目类别投影到假定的潜在需求空间，该矩阵作为全局控制器来学习项目类别空间之间的语义关联。其次，根据项目的需求得分构建需求感知图，学习需求感知项目嵌入。并根据邻居消息传递的特点，将项目需求得分作为门控单元来管理项目间的消息传递。相互损失旨在进一步提高学习项目嵌入的质量，用于后续预测。

模型

基于需求感知的图神经网络模型，分为三个部分：（1）需求建模组件，（2）需求感知项目嵌入组件，（3）需求推动的推荐组件

给定一个会话，通过需求建模组件获得需求权重向量。然后，基于构建的需求图，通过gnn层学习需求感知项目嵌入。最后，生成带有最后一项嵌入的会话嵌入以供推荐

需求建模组件

用于对每个输入会话中可能包含的底层需求进行建模。

给定一个项目会话V以及类别序列C，首先将C分别投影到M个需求空间中，M是一个预定义的值。可以在需求空间中获取类别之间的相关性。

C为类别嵌入序列，

D^m

为第m个需求的表示

为了获取会话中包含的多个需求的表示，将生成的需求表示沿类别方向聚合到需求表示向量中。

d_i^m

为

D^m

中第i列，表示为第m个需求空间中第i个项目的需求表示。

d^m

表示为当前会话的第m个需求表示

先分别计算s和 $v_t$ 的类别查询向量，再分别计算会话s的需求分数 $z^m$ 和目标项 $v_t$ 的需求分数 $z_t^m$ 。

会话s的类别查询向量和需求分数

目标项

v_t

的查询向量和需求分数

其中，K为第m个需求空间中的查询矩阵， $z^m$ 的第i个 $z_i^m$ 为第i类对第m类需求 $d^m$ 的贡献。

需求感知项目嵌入组件

构造需求图以保持顺序依赖性：给定一个会话 $s=\left\{ (v_1,c_1),(v_2,c_2),...,(v_\vert s \vert ,c_\vert s \vert ) \right\}$ ，我们构建每个有向需求图 $G^m=(V, E^m)$ 以保持项目间的顺序，其中V表示s中包含的所有不同的项目， $E^m$ 表示第m个需求空间下的 $G^m$ 的边集。