推荐系统(二)-NFM、AFM和DeepFM模型

1、背景

1.1 wide&deep

首先来介绍一下wide&deep模型，模型结构如下图

The spectrum of Wide & Deep models.

模型中，wide部分负责记忆，deep部分负责扩展(泛化性)。一些重要特征往往放在wide的浅层，一些隐性的特征可以放在deep部分借助于embedding的学习和隐性交叉来学习特征之间的交互。

1.2 FNN

和wide deep出发点一样，一些线性模型LR很难学到非线性表达，非线性模型比如FM, GBDT又很难学到所有的特征组合方式。那么，如何利用DNN去自动学习到特征表达，自动去学习到特征之间的交叉呢？

首先需要对category特征进行一个one-hot编码。

l1, l2层都是隐藏层，那么， dense real layer 就可以看作一个embedding层，每个field 分别对应一个embedding的过程。通常，使用FM去初始化这些参数往往能够更快地收敛，最大限制避免训练过程中陷入局部最小，以及得到更好的结果。可以看到，FNN其实就是widedeep模型的deep部分，但是FNN有用FM进行一个参数初始化的过程。

FNN 模型

1.3 PNN模型

上一篇文章介绍了PNN模型

PNN的结构的思想相比于WideDeep模型核心改动地方在对于embedding后的dense feature，增加了两两交叉的功能，widedeep是embedding feature全部输入到隐藏层了。不同field经过Embedding后的特征做点击运算其实就相当于FM，那么PNN认为首先需要确保学习到这些交叉特征，再去额外交给DNN去学习更复杂的交叉特征。那么PNN结构其实相当于FM+DEEP。

再说下网络细节: Embedding layer 和Wide Deep模型是一样的，不同field特征映射到了一个embedding的空间上，这时，不是所有的特征直接送到一个NN网络里面去，这里分成两个部分z 和p。

z部分直接就是原始的embedding特征不变;

P部分是embedding特征两两做内积运算，达到FM的效果，接下来z和p拼接成一个vector，送到一个NN网络里面，最后softmax输出概率值。