登录注册写文章

知乎推荐系统

欧文坐公交

知乎推荐系统

召回模块

标签类
- 基于用户历史回答过的话题、关键词召回
- 基于用户关注、浏览等兴趣话题去召回
- 基于内容分类去召回
embedding召回
- 创作话题、兴趣话题有embedding，通过最近邻去召回相似的问题
- 通过深度学习模型学习出来embedding召回
协同类模型
热门或其他策略类召回

排序模块

ranking特征

问题侧主要是问题的话题、文本、时间、提问作者
用户侧主要是用户基础特征、用户兴趣、用户历史创作特征
交叉特征：问题与历史回答话题相似度、文本相似度等

ranking模型

传统GBDT、GBRank，在一些不追求极致效果情况中有一定优势
深度学习模型：Wide&Deep、DeepFM，效果有较大提升，但训练要求资源多，样本规模大
ESMM（多目标）

目前模型主要是天级更新，在做onlinelearning的尝试

一些tips

模型融合或者复杂网络可能在比赛中有效，但是在实际生产中要考虑实际情况，一般情况下留给ranking阶段的时间不超过100ms，如果模型过于复杂，运行时间往往得不到标准，一般会使用单一的模型，或者直接使用多目标或多任务目标学习模型。
线上仍有不少地方在使用GBDT、GBrank，树模型有一些非常大的优势：模型简单，可解释性强，需要的样本量不大，训练时间短，使用资源少，模型稳定，一定时间不更新衰减比较弱，可维护性比较强，在一些不过分追求极致效果的情况使用比较多。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

【知乎】推荐页Ranking经验分享
原文标题：《知乎推荐页Ranking经验分享》原文作者：DataFun —— 单厚智原文链接：https://...
Midorra阅读 1,896评论 0赞 2
知乎首页推荐系统
知乎推荐系统的实践及重构之路知乎如何洞察你的真实喜好？首页信息流技术揭秘前记架构部分主要是针对业务的发展把召回...
xiiatuuo阅读 3,143评论 0赞 0
个性化推荐排序详解
原文链接：https://mp.weixin.qq.com/s/lUP2BehOh7KczR3WRnOqFw 爱奇...
御风之星阅读 16,275评论 2赞 15
推荐系统遇上深度学习(三十九)-推荐系统中召回策略演进！
推荐系统中的核心是从海量的商品库挑选合适商品最终展示给用户。由于商品库数量巨大，因此常见的推荐系统一般分为两个阶段...
文哥的学习日记阅读 9,446评论 1赞 26
iOS源码解析：多线程<二>线程同步
多线程的安全隐患在使用多线程的过程中，一块资源可能会被多个线程共享，也就是多个线程可能会访问同一块资源，同一个变...
雪山飞狐_91ae阅读 724评论 0赞 1

赞1赞

赞赏

手机看全文