推荐系统遇上深度学习(一二六)-[华为]信息共享的并行化深度CTR模型

今天给大家带来一篇华为在CIKM2021上中稿的文章。通过在并行CTR预估模型引入信息共享机制来提升特征交互的效果,一起来看一下。

1、背景

CTR预估中的特征交互可以分为显式特征交互和隐式特征交互两类。不同的CTR预估模型对这两类特征交互建模形式存在一定的差异,主要可以分为两种结构:并行结构(parallel structure)和堆叠结构(stacked structrue),如下图所示:

其中,堆叠结构如PIN、DIN和DIEN,而并行结构如DeepFM、DCN、XDeepFM等。本文主要关注如何在并行结构的CTR模型中进行创新。先来回顾一下上述并行模型的结构,如下图:

对于上述的并行结构的CTR预估模型,以DCN为基础,论文提出了两点可能影响模型效果的问题:

1)隐层信息共享不充分:DCN的整体模型结构分为cross网络和deep网络,分别用于建模显式和隐式的特征交互,并在最后的输出层进行结果的融合。论文称这种方式为late fusion。在这种方式下,两个并行的网络在中间层不存在任何的特征交互,这容易导致梯度倾斜问题(skewed gradients)
2)网络输入过度共享:cross网络和deep网络共享同一个embedding层作为输入,但不同的特征可能适合于不同的交互方式,不加区分的将所有特征输入到并行的多个网络中可能导致次优的结果。

针对上述两方面的问题,论文提出了Enhanced Deep & Cross Network (简称EDCN),在DCN的基础上增加了bridge module和regulation module,前者用于在cross和deep网络之间进行信号传递 ,后者则用于筛选用于不同网络的特征组合。接下来,对EDCN进行详细介绍。

2、EDCN介绍

2.1 DCN回顾

首先来简单回顾一下DCN的模型结构,如下图所示:

在DCN中,Embedding分别输入两个并行的网络中,分别为Cross network和Deep network,用于建模特征之间的显式和隐式交互。两部分网络的输出在最后进行融合,进而得到CTR的预估值。

前文也提到,论文提出了DCN主要存在的两点问题,分别是隐层信息共享不充分和网络输入过度共享。为了克服这两方面的问题,论文提出了EDCN,结构如下图所示:

可以看到,EDCN在DCN的基础上,引入了Bridge Module和Regulation Module。接下来,对这两个模块进行介绍。

2.2 Regulation Module

这里与论文介绍的顺序进行了调换,先来介绍下Regulation Module,主要是为了方便后续Bridge Module的介绍。

DCN中将所有的特征都输入到两个子网络中,而在论文《AutoFeature: Searching for Feature Interactions and Their Architectures for Click-through Rate Prediction》中提到,不同的特征适合不同的交互方式。因此,论文借鉴MMoE中的门控机制,在DCN中引入了Regulation Module,图示如下:

可以看到,每一个子网络都有一组可学习的权重向量G(从Embedding层得到子网络输入时,权重是field-wise的),经过softmax之后与输入的Embedding进行如下运算,得到每个子网络的输入:

2.3 Bridge Module

前文也提到,DCN这类只在最后输出层对两个并行子网络输出进行融合的方式,称之为late fusion,对这种方式而言,无法捕捉到中间层中两个并行网络之间的相关性,削弱了显式和隐式特征交互之间的交互信号,同时在反向传播时可能出现梯度倾斜的现象。

论文引入了Bridge Module,来捕获并行网络之间层级的交互信号。这种融合的方式,论文称为dense fusion策略,两种融合策略的对比如下图所示:

那么Bridge Module具体是如何实现的呢,其实就是将Cross Network和Deep Network的中间层的输出做了一个融合fl=f(xl,hl),需要保证两个网络中间层的输出长度是一样的,而融合后的结果也是相同的长度。f是提前定义好的交互公式,可以随意定义,论文给出了其中四种方式:
1)对位相加:


2)对位相乘(哈达玛积):

3)拼接后经过一层MLP:

4)Attention Pooling:

经过Bridge Module之后得到的融合向量,并不是直接输入到下一层子网络中的。这个时候,Regulation Module又派上用场了,融合向量会经过Regulation Module分别得到两个子网络的下一层输入。论文中也指出,Cross Network中每一层的输出是初始输入x0的线性变换,因此filed信息还保留在Bridge Module之后的融合向量中,所以中间层的Regulation Module仍然使用field-wise的形式。

最后值得一提的是,论文中提出的Bridge Module和Regulation Module是具有一定的可扩展性的,比如Regulation Module可以应用在任意的并行结构中,如DeepFM、xDeepFM、AutoInt等,而Bridge Module需要并行的子网络的具有相同的网络层数和中间维度,可扩展性较差,Wide & Deep、DeepFM都不行。

3、实验结果

最后来看一下实验结果,首先是和base模型的对比:

接下来看一下Bridge Module和Regulation Module的可扩展性分析,将Bridge Module应用于XDeepFM等模型中,在不同数据集上都有一定效果的提升:

而将Regulation Module分别应用在DeepFM、XDeepFM等模型中,同样在不同数据集上都有一定效果的提升:

然后再看下Bridge Module不同计算方式的效果,哈达玛积的效果最优:

最后看一下线上效果,尽管耗时有一定的提升,但是在CTR和eCPM上提升明显:

好了,论文就介绍到这里,有一点疑惑没有解开,那就是对于梯度倾斜现象的分析,论文中一直在强调这一点但最后的实验中并没有给出相应的解释和数据。另外,对于DCN来说,两个子网络是具有明确的作用的,即分别建模显式和隐式交互,中间加入Bridge Module之后,两个网络的作用反而不是那么明显了。总之论文的创新点是有的,但感觉有些地方不是特别严谨。感兴趣的小伙伴可以阅读原文~~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,809评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,189评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,290评论 0 359
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,399评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,425评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,116评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,710评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,629评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,155评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,261评论 3 339
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,399评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,068评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,758评论 3 332
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,252评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,381评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,747评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,402评论 2 358

推荐阅读更多精彩内容