登录注册写文章

零基础入门推荐系统——task05: 排序模型+模型融合

零基础入门推荐系统——task05: 排序模型+模型融合

经过前面的候选文章召回和特征工程，将文章和用户点击日志信息处理成监督学习数据集，接下来就使用排序模型或二分类模型搭建模型进行学习，对测试集进行预测，得到测试集中的每个候选集用户点击文章的概率，返回点击概率最大的topk篇文章，作为最终输出结果。

排序模型选择三个比较有代表型的模型：

LGB的排序模型
LGB的分类模型
深度学习的分类模型DIN

集成学习方法（其实LightGBM也是集成学习模型的一种，这里是从单模型结果与多个模型的区分）：

三个模型输出结果的加权融合
加权融合：根据模型训练效果给模型不同的权重，然后求和得到最终文章点击的概率
Stacking（使用5折交叉验证将模型输出结果作为特征，再使用简单模型logistic模型进行训练）
stacking方法，实施过程可以看下图：

stacking_flow.jpg

（图片转自这里）
stacking是一种分层模型框架，对于两层stacking，第一层由多个基学习器组成，输入为原始训练集，第二层是将第一层基学习器的输出作为特征加入训练集进行训练，从而得到整个stacking模型。

上图划分步骤：
1. 通过k-flod的方式将training data划分成5份，基学习器训练五轮后分别得到每轮training data划分的一份验证集预测结果，将五份验证集的预测结果堆叠起来得到全部训练集的新特征，若有多个基学习器则生成多个新特征；
2. 基学习器得到的新特征加入训练集中，使用二分类模型进行训练；
3. 针对test data的预测，使用每个基学习器训练得到的5个模型分别预测，将预测结果求平均获得对应基学习器的预测特征，将预测结果带入data中使用第二层模型预测得到最终预测结果。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

Datawhale 零基础入门数据挖掘-Task5 模型融合
Datawhale 零基础入门数据挖掘-Task5 模型融合融合是提分和提升模型鲁棒性的一种重要方法，主要有： ...
YAN_DUDU阅读 1,234评论 0赞 0
Task05 天池新闻推荐入门赛之【排序模型+模型融合】
学习文档：http://datawhale.club/t/topic/202[http://datawhale.c...
0error_阅读 2,701评论 0赞 0

Datawhale 零基础入门CV赛事-Task5 模型集成
最后一章，将会学习如何使用集成学习提高预测精度，通过学习知道集成学习方法以及交叉验证情况下的模型集成，最终学会使用...
北洋军阅读 1,220评论 0赞 0
家长会谈合作
久违的晴天，家长会。家长大会开好到教室时，离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。放学铃声...
飘雪儿5阅读 12,214评论 16赞 22
2019－11－28 周四阴
今天感恩节哎，感谢一直在我身边的亲朋好友。感恩相遇！感恩不离不弃。中午开了第一次的党会，身份的转变要...
余生动听阅读 13,596评论 0赞 11

友情链接更多精彩内容

赞1赞

赞赏

手机看全文