基于标签的召回

       基于标签的召回应该是召回策略中最简单直接的一种方式,而这种方式的基础是要有个能准确且详细描绘用户和item的标签体系。

        标签体系主要是帮助机器来认识和了解我们的用户及内容。包括用户的一些基本属性(例如年龄,性别、省份等),身份属性(如是否是注册用户、是否是会员用户等),还包括用户的兴趣属性、内容倾向等。基于这样的理解,制定了视频平台所用的标签体系,如下图(图中隐藏了部分信息):

标签体系

       有了标签体系,不仅对于召回有很大的提升,还对相关推荐、简单的个性化推荐都有较大的帮助,且推荐效果也不会太差。这篇主要说召回,那我们就重点说下基于标签的召回。目前我们主要用两种方式:

1、单标签召回

        单标签是直接筛选一些分类或细分标签作为召回的有效标签(如CATEGORY_电影、PEOPLE_杨幂、TIME_晚上、VIP_芒果等),这种方式简单、粗暴,且召回结果丰富,不存在召回结果为空的情况。当然,具体用哪些标签是是一个关键点。一方面是因为部分单标签会存在包含关系,所以不加筛选的话召回结果的重复占比会很高,对召回的性能也有影响;另一方面,为了帮助用户更精准的筛选候选集,不同类型的用户(如冷启动用户与活跃用户,会员用户与普通用户等)所用的召回标签肯定也存在差异。

2、组合标签召回

        上面说的单标签召回存在召回结果重复率高、不精准的问题,虽然召回结果丰富,但做了过滤后,有效的结果是有限的,那我们为啥不通过召回本身过滤掉重复和效果不好的呢,于是就有了组合标签召回。

        我们的标签是分了多级的,组合标签召回可以是同级标签组合(如CATEGORY_电影_AND_PEOPLE_杨幂)、多级标签顺序组合(如CATEGORY_电影_AND_STYLE_搞笑),也可以跨分类多级组合(如SEX_女_AND_VIP_芒果_AND_CATEGORY_综艺),还可以将静态标签与动态标签进行组合、固有属性标签与用户行为进行组合等,具体组合类型及组合的深度可通过产品特性和业务特点大家自己去发现和探索。即使不做太多优化,组合标签召回的效果也比单标签好很多,下图是仅加入了同级标签组合和多级标签顺序组合后的实验数据(2802:对照组(单标签);2811:组合标签实验):

组合标签实验上线两周后的数据表现

        从实验数据看,推荐效果上的各项指标都比单标签的对照组有所提升,同时在推荐请求耗时上比单标签降低不少。整体来看组合标签召回的效果和预期一致,后续继续优化,指标上应该还会有一些提升^_^

ps.若是朋友们在标签召回方面有较好的优化点也可与我分享哦O(∩_∩)O~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容

  • 概述及标签体系搭建 1 概述 随着信息技术的迅速发展和信息内容的日益增长,“信息过载”问题愈来愈严重,愈发带来很大...
    JinkeyAI阅读 22,771评论 10 241
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 171,880评论 25 707
  • 《赞美龄》 夫唱妇随家和睦 重担险途义敢挑 水墨挥洒怀天地 情志优雅得逍遥 一代美范成经典 三世跨界存玄妙 人生百...
    赛德传播阅读 325评论 0 0
  • 福天思想(微信公众号同名):新浪专栏作家 生活中,形形色色的人都有,无论你遇到怎么样的人,当你有了怒火的念头就已经...
    福天思想阅读 358评论 0 0
  • 吴军老师今天在硅谷寄来的信中说:大数据更能发现真实。 老师先从热点某离婚案切入,然后分析人们的真实情绪后通过对比以...
    纯纯净水阅读 1,174评论 0 0