话不多说先上图。
新闻推荐(资讯推荐)属于内容推荐的一种,总的来说是资源池内容与被推荐用户的匹配与排序模型。
资源池处理包括:文本分类,总的来说分成2类,一类是人工分类,由运营编辑手工进行分类。另一类机器自动分类,采用自然语言处理,一般需要分词聚类等方法,较高难度需要语义分析等。最后输出为新闻id对应主题ID。
用户偏好画像:用户偏好画像是用户画像的组成部分。分热启动和冷启动区别,热启动可根据历史用户阅读习惯进行主题标签数学建模。冷启动可根据其他用户群体之间的共性进行打标。
将资源池与用户偏好画像结合起来,根据双方权重进行排序。
简单介绍推荐流程,具体细节会后期单独展开