因果推断推荐系统工具箱 - DICE（二）

文章名称

【www-2021】Disentangling User Interest and Conformity for Recommendation with Causal Embedding

核心要点

上一节描述了作者如何对兴趣和流行度倾向进行拆分，并通过SCM进行建模。这一节讲解，如何利用特定的因果数据学习模型参数，并且利用多任务学习和课程学习稳定学习过程。

方法细节

问题引入

模型建模完成后，就需要对模型进行学习（机器学习三要素，模型、优化目标、优化方法 :P)。作者提出了如下图子图b所示的优化目标，其中包括4个loss，需要利用多任务学习进行优化，但是除了点击反馈，我们没有其他数据，如何优化discrepency loss，interest loss以及conformity loss呢？

![learning process]

image.png

具体做法

从如下图子图a所示的因果图上可以看出，用户的点击反馈符合因果图中的collider结构。在不控制（没有观测）点击反馈随机变量 $Y_{u, i}$ 的时候，兴趣随机变量（embedding $u^{(int)}$ ）和流行度倾向随机变量（embedding $u^{(con)}$ ）是相互独立的。一旦观测到 $Y_{u, i}$ 时，两者将不再独立。例如，物品的流行程度和用户对这个物品你的偏好程度（更合理的应该是说，物品的特质，比如颜色什么的，和它的流行程度没有固定的相关性）应该是独立的。观测到用户点击了某个物品，那么这个物品要么被用户喜欢，要么相对比较流行（因为我们只关心这两个因素，当然也可能是其他因素影响的，可以拿同样的框架来建模），物品即不被用户喜欢也不太流行的可能性比较低（从概率上说比较严谨一点）。这体现了对撞结构（collider）的特性，作者利用这个特性，来构造数据集。

causal graph

利用上节所说的用户和物品的兴趣（特质）embedding和用户与物品的流行度倾向embedding，分别构建两个评分矩阵 $M^C, M^I$ ，则可以依据如下讨论获得几组不等式关系。

物品 $a$ 比物品 $b$ 的流行度高，并且用户点击了 $a$ 物品，没有点击 $b$ 物品。

这种情况我们不知道用户是否更偏好 $a$ ，但是我们可以知道1） $a$ 物品的流行度倾向得分应该高于 $b$ 物品，即 $M^C_{u, a} > M^C_{u, b}$ ；2） $a$ 物品的整体的反馈预测得分应该高于 $b$ 物品，即 $M^C_{u, a} + M^I_{u, a} > M^C_{u, b} + M^I_{u, b}$
物品 $c$ 比物品 $d$ 的流行度低，并且用户点击了 $c$ 物品，没有点击 $d$ 物品。

这种情况我们可以知道1）用户一定更喜欢 $c$ ，因为即便它不流行，用户仍然点击了它，即 $M^I_{u, c} > M^I_{u, d}$ ；2） $a$ 物品的流行度倾向得分应该低于 $b$ 物品，即 $M^C_{u, c} < M^C_{u, d}$ ；3） $c$ 物品的整体的反馈预测得分应该高于 $d$ 物品，即 $M^C_{u, c} + M^I_{u, d} > M^C_{u, d} + M^I_{u, d}$

遵循以上两种情况，可以构建两个数据集 $O_1, O_2$ 分别表示1）负反馈的产品比正反馈的产品流行度低；2）负反馈的产品比正反馈的产品流行度高（这两个数据集都从原始观测数据集 $O^click$ 中构造而来）。

通过构造2个数据集和2组（5个）不等式，我们可以用来训练3个（预测）得分矩阵， $M^{click}, M^I, M^C$ ，即3个损失（点击率预估损失，物品偏好预估损失和用户对物品的流行度倾向估计损失）。

除此之外，作者构造了discrepancy loss，用来确保两种embedding（兴趣embedding和流行度倾向embedding）互相解耦（不相似）。作者尝试了三种方式实现discrepancy， $L1-inv, L2-inv, dCor$ ，属于比较常规的提升discrepancy的方法，详情参见[1,2]。

由于是不等式，因此和估计评分与点击概率不同，需要利用pairwise的损失函数学习排序（保序性），作者利用BPR方法进行优化求解。训练样本为三元组 $(u, i, j)$ ，其中 $i, j$ 分别对应正反馈和负反馈的物品id。并且， $O_1, O_2$ 中 $i, j$ 的流行度高低遵循相应的限制（例如， $O_1$ 中 $i$ 的流行度高于物品 $j$ 的流行度， $O_2$ 同理）。

各部分的BPR损失如下图所示，依次是流行度倾向性模型，兴趣模型，点击率预估。其中，点击率预估的损失中，拼接了两种embedding（符号 $||$ ）。

conformity loss

interest loss

click loss

整体的损失函数如下图所示，其中 $\alpha, \beta$ 为超参，由于点击率预估是主要任务，所以作者没有对这个损失进行参数调节（始终保持参数是1）。

total loss

最后，在整个模型参数的学习过程中，作者遵循了课程学习的思路，由简单到困难收集样本，并且动态调整附加任务的权重。

选取与正样本具有相似流行度的负样本，并逐渐拉大流行度差距（假设正样本流行度为 $p$ ，选取流行度范围在 $p + m_{up}, p - m_{down}$ 以内的负样本， $m_{up}, m_{down}$ 随着epoch的增加逐渐加大）。作者称之为基于流行度的负采样。
随着epoch的增加逐渐加大 $\alpha, \beta$ ，提升附加任务的影响。

心得体会

对撞结构

审视全文，其实建模上，作者主要利用的是传统的推荐模型的建模思想，embedding结合多任务学习，只不过考虑了两个embedding分开，并没有太多的因果的东西在里边（没有像IPS那种weighting什么的，虽然分开的embedding给出了对撞因果结构）。个人认为作者思路中的亮点是优化部分，体现了因果推理的思维。作者利用对撞结构的相关性，推导了多个不等式，解决了没有监督信息来分开学习embedding的难题，同时具有坚实的理论保证。

关于对撞结构，文中举的例子可能更贴切一点。一个人长得好看和脾气好没有什么关系（相互独立，不要跟我聊什么相由心生:p）。但是两者共同决定一个人是否受欢迎，如果这个人被确认是受欢迎的，那么他要么长得好，要么脾气好（不考虑其他的）。这个例子，比流行程度和物品特质这个例子更好理解。

等式到不等式

作者利用对撞结构构造了2类数据，并且利用2类数据构造了4个损失。由此，从pointwise的估计转变为pairwise的估计。个人感觉是本文设计的巧妙之处，并且合理的利用了BPR。此外，pairwise的负采样也非常讲究，负采样的好坏直接影响了模型的性能。作者基于流行度提出的负采样方法，符合优化需求，思路值得借鉴。

文章引用

[1] Gábor J Székely and Maria L Rizzo. 2009. Brownian distance covariance. The annals of applied statistics (2009), 1236–1265.

[2] Gábor J Székely, Maria L Rizzo, Nail K Bakirov, et al. 2007. Measuring and testing dependence by correlation of distances. The annals of statistics 35, 6 (2007), 2769–2794.

禁止转载，如需转载请通过简信或评论联系作者。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 215,384评论 6赞 497
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,845评论 3赞 391
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 161,148评论 0赞 351
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,640评论 1赞 290
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,731评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,712评论 1赞 294
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,703评论 3赞 415
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,473评论 0赞 270
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,915评论 1赞 307
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,227评论 2赞 331
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,384评论 1赞 345
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,063评论 5赞 340
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,706评论 3赞 324
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,302评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,531评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,321评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,248评论 2赞 352