因果推断推荐系统工具箱 - CauSeR(二)

文章名称

【CIKM-2021】【CS Research, New Delhi, India】CauSeR: Causal Session-based Recommendations for Handling Popularity Bias

核心要点

文章旨在解决Session-Based推荐场景下Popularity带来的Bias对长尾物品推荐的影响。流行物品的过渡曝光影响了长尾物品的曝光,并且这种偏差会在模型训练过程中不断被放大。作者认为这种影响在1)数据收集;2)魔性训练两个阶段都会有影响。数据收集时的偏差源于Popularity带来的Conformity Bias,而模型训练时的偏差来源于样本不平衡导致的偏差(可以理解为传统的Popularity Bias)。不同于现有方法,作者考虑联合解决两种偏差。

上一节介绍了CauSeR模型解决的问题背景和形式化,本节继续介绍模型的训练和预测。

方法细节

问题引入

如前所述,SRS的整个建模过程收到了数据收集和训练两个阶段的偏差影响。两个过程的因果图,如下所示。作者认为,为了纠正偏差,需要做的就是同时估计S, IY的直接因果效应(有些同学可能在想,为啥不是估计I \rightarrow R \rightarrow Y,因为我们希望得到的是这个因果效应。是的,但这个值不如估计直接因果效应简单,我们只需要估计全部的因果效应,并从其中去除掉DE,即可以得到IDE)。

Causal Graphs

作者把SY的直接因果效应建模为P(Y|do(S), I),而IY的直接(我理解应该是IDE,也就是通过相关性产生的)因果效应建模为P(Y|I)。并且,把SRS的整体预估模型建模为P(Y|do(S), I) * (P(Y|I))^\beta(这里\beta小于1,用来调节Conformity Bias,因为Conformity Bias让流行的物品具有更高的被点击概率)

具体做法

Training

P(Y|do(S), I)

作者利用如下图示的的公式,估计P(Y|do(S), I),其中\textbf{s}是session的嵌入表示,\textbf{i}_j表示的是第j个物品的嵌入表示,\textbf{d} = \hat{\textbf{d}}cos(s, \hat{\textbf{d}})||\textbf{s}||, \hat{\textbf{d}} = \frac{\overline{s}}{||\overline{s}||}, \overline{s} = \mu.\overline{s}_{t-1} + \overline{s}_t表示session embedding在头部物品方向的投影,s_t是session embedding在t时刻的平均值(感觉原作写的可能有误,s_t是session embedding在t时刻的?而非平均),\overline{s}_t是session embedding在整个过程中的加权平均(类似动量,利用\mu做了滑动平均)。

𝑃(𝑌|𝑑𝑜(𝑆),𝐼)

作者利用[1]中的多头方法,把物品的各个维度和session embedding的各个维度平均分为K个组,可以被看做是从M中采样的K个值。最终,P(Y|do(S), I)的logits可以表示为如下图所示的公式。

𝑃(𝑌|𝑑𝑜(𝑆),𝐼) logits

其中\tau为缩放超参数(应该就是softmax里的Temprature),s = f(I_s; \theta)表示利用SRS backbone模型f计算session的embedding(作者利用SR-GNN作为这个backbone),\theta是backbone模型的参数,I_s = [i_{s,1},...,i_{s,l}]^\top表示在当前session,用户行为序列中各个物品embedding。

P(Y|I)

P(Y|I)的logits如下图所示,其中\textbf{w}是可训练的参数。

P(Y|I) logits

综上,\hat{\textbf{y}}_{s,j} = softmax([Y|do(S=s), I=i_j])\hat{\textbf{y}}_{j} = softmax([Y|I=i_j])。因为\hat{\textbf{y}}_{s,j}, \hat{\textbf{y}}_{j}分别表示对P(Y|do(S), I), P(Y|I),对应到上述模型的整体预测为P(Y|do(S), I) * (P(Y|I))^\beta = \hat{\textbf{y}}_{s,j}, \hat{\textbf{y}}_{j}^\beta

对这个式子两边取log得到最后的目标函数\mathcal{L}(s) = \mathcal{L}_R + \beta\mathcal{L}_I,其中\mathcal{L}_R = - \sum_{j=1}^n \textbf{y}_{j}log(\hat{\textbf{y}}_{s,j}), \mathcal{L}_I = - \sum_{j=1}^n \textbf{y}_{j}log(\hat{\textbf{y}}_{j})

Inference

在训练阶段模型去掉了M \rightarrow S的混淆影响,并估计了I \rightarrow Y。但是在预测时,仍然可能存在经由中介变量(mediator)D,得到的IDE S \rightarrow D \rightarrow Y。为了去掉这个影响,准确估计S \rightarrow Y的直接影响,作者利用如下公式计算DE(S \rightarrow Y)(其实就是从total effect里减去了估计的IDE,公式的推导,作者建议参阅[1])。其中\alpha用来平衡IDE和DE。

DE(S \rightarrow Y)

因此,在预测时,\hat{\textbf{y}}_{s,j} = softmax(DE(S \rightarrow Y))

心得体会

P(Y|I)

这里作者说利用P(Y|I)表示IY的直接影响,感觉有一点奇怪。主要看说的是哪个阶段。因为,在训练阶段,IY的影响是没有偏差的,所以是直接因果效应没问题。但是IY的偏差实际来自数据收集阶段,这个时候,P(Y|I)表示的应该是物品对点击的整体因果效应,从中间去除的I \rightarrow Y的DE(Conformity Bias),就得到了I \rightarrow R \rightarrow Y。这一步是通过\beta \in [0, 1]实现的,小于1的指数相当于对P(Y|I)作了折扣。

文章引用

[1] Kaihua Tang, Jianqiang Huang, and Hanwang Zhang. 2020. Long-Tailed Classifi- cation by Keeping the Good and Removing the Bad Momentum Causal Effect. In Advances in Neural Information Processing Systems, H. Larochelle, M. Ranzato, R. Hadsell, M. F. Balcan, and H. Lin (Eds.), Vol. 33. 1513–1524.

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,919评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,567评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,316评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,294评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,318评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,245评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,120评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,964评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,376评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,592评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,764评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,460评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,070评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,697评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,846评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,819评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,665评论 2 354

推荐阅读更多精彩内容