DeepFM:A Factorization-Machine based Neural Network for CTR Prediction

来源：IJCAI17，DeepFM论文链接

DeepFM

由FM component和Deep component组成

原始数据 = 种类特征(eg. gender, location) + 连续特征(eg. age) + label

种类特征进行one-hot编码

连续特征可直接使用，或者先进行离散化在进行one-hot编码

特征按照field分组

综上：原始数据-> (x, label)
x = [x_field₁,x_field₂,x_field₃,...,x_{field_m}]

DeepFM

计算公式：

$$y = sigmoid(y_{FM} + y_{DNN})$$

其中y_FM为FM component的输出，y_DNN为DNN component的输出。y∈{0,1} ，为CTR预测概率。

$$y_{FM} = \left< x,y \right> + \sum_{i=1}^d\sum_{j=i+1}^d\left< V_{i},V_{j} \right>x_{i}\cdot x_{j}$$

FM component包含了加法单元和内积单元。
加法单元：提取一阶特征，直接从原始特征提取。
内积单元：原始特征先进行embedding，然后由embedding后的输出经过内积单元提取二阶组合特征。

最终维度：field_size + embedding_size
embedding_size对应的是：!$\sum_{i=1}^d\sum_{j=i+1}^d\left< V_{i},V_{j} \right>x_{i}\cdot x_{j}$

FM component总结：

用来提取高阶组合特征。
原始特征首先经过embedding层降维后，然后经过多个全连接隐藏层输出，即y_DNN

DeepFM：一阶特征(FM)+二阶特征(FM)+高阶特征(DNN)

在DeepFM之前有其他几个模型：

FNN

PNN(变体：IPNN, OPNN, PNN*)

Wide&Deep

FNN与PNN的不足之处：
仅能提取高阶组合特征，低阶组合特征无法获取。

Wide&Deep的不足之处：
在Wide部分还需要进行人工特征工程。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。