CTR 预估（上）

简介

推荐系统通常分为召回和排序两个步骤
召回：粗排选取合适的内容，可以通过协同过滤，兴趣tag，内容最热等方式
排序（CTR预估）：使用一个点击率预估模型（输入用户特征，内容特征，用户内容交叉特征等）对召回出来的内容进行排序

Deep & Wide

LR是一个简单的线性模型，其不具备学习高阶特征的能力
而通过DNN+embedding可以较好的学习到更抽象的特征达到泛化的效果
在CTR预估任务中结合LR和DNN实现记忆+泛化的效果

实际效果

DeepFM

2way-FM就是在线性回归的基础上加一个特征交叉系数矩阵w，意在自动学习组合特征

实际上会对矩阵w做分解，变成向量的乘积，这样可以提高效率

实际上还有一种叫FFM的方法针对不同特征域有单的向量v

所以结合FM和DNN就能得到一个新的CTR模型DeepFM
FM和DNN共享了embedding层

实际效果

DNN for YouTube

借鉴了Word2Vec的思想，使用历史行为预测下一个点击
https://github.com/PaddlePaddle/models/tree/develop/legacy/youtube_recall

视频向量即softmax层的W参数
本质上就是一个类似于CBOW的多分类问题

DSSM

深度语义匹配模型
DSSM最大的卖点在检索场景下使用点击数据来训练语义层次的匹配
Q是用户的查询
D是文档的特征

Word Hashing 是一个解决字典太大的trick参考
http://www.mamicode.com/info-detail-1909443.html

在推荐场景下Q可以理解为用户特征
而D为内容的特征

GBDT + LR

因为决策树可以学习高阶特征
所以使用GBDT构造一个二分类问题进行特征预处理
然后把每颗子树的输出（根据最后的叶节点位置进行one hot编码）交给LR进行预测

GBDT 二分类
把目标损失函数定义为交叉熵损失函数
然后利用sigmoid预测概率值

Deep & Cross

DCN模型的输入包括了sparse特征，dense特征, embedding特征，而模型训练阶段分成两个部分，右边部分是传统的DNN模型的deep层，其中每个deep层后都接入relu激活层, 把原始特征通过多个隐层使得特征变得更加高阶，而左边的cross layer通过一个递归的特征组合公式

每一层的特征都由其上一层的特征进行交叉组合，并把上一层的原始特征重新加回来。这样既能做特征组合，自动生成交叉组合特征，又能保留低阶原始特征，随着cross层的增加，是可以生成任意高阶的交叉组合特征（而DeepFM模型只有2阶的交叉组合特征）的，且在此过程中没有引入更多的参数，有效控制了模型复杂度。最后把cross层的输出结果和deep层的输出结果组合到一块来进行LR模型训练，在我们的业务场景下，就是预估user_id在<catid, item>pair下的点击概率。

CTR 预估（下）

最后编辑于：2019.02.15 16:52:47

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

CTR 预估（上）

CTR 预估（上）

简介

Deep & Wide

DeepFM

DNN for YouTube

DSSM

GBDT + LR

Deep & Cross

下一篇

相关阅读更多精彩内容

友情链接更多精彩内容