推荐系统浅知

在个性化盛行的时代,推荐系统成为产品架构中重要一环,承担引导、匹配信息等需求。本人由项亮老师的<推荐系统实践>出发,介绍推荐系统的一些基础知识点。

有兴趣的朋友强推<推荐系统实践>

一.什么是推荐系统

在这个海量信息的时代,信息过载给人们带来太多的成本。

人们逛一家超市想买抽纸,在超市里面众多的商品中找到抽纸是非常困难的,想要快速找到想买的抽纸必须依靠超市的指示牌。

那引申到互联网,如何短时间内找到用户所需要的信息?

早期是依靠分类目录来帮助用户找寻信息,但随着互联网规模不断增大,分类目录已不能满足人们的需求。

图片:早期网站检索依靠目录为主

据IDC《数字宇宙》的研究报告表明,2020 年全球新建和复制的信息量将超过40ZB,是2012年的12倍;中国的数据量在2020年超过8ZB,比2012年增长22倍。

图片发自简书App

在庞大数据量的推动下衍生出了搜索引擎,用户可以通过搜索引擎来精准的找到自己需要的内容。

搜索引擎的劣势是当用户不能精确地描述自己需要的信息的时候,搜索引擎就不能发挥作用,这时候就诞生出了搜索推荐

从这个角度出发,推荐系统和搜索系统的本质是一样的,可以快速发现有价值的信息。

不一样的是,推荐系统不需要用户提供明确的需求,而是通过分析用户历史行为给用户建模,只能推荐满足用户兴趣和需求的信息。

图片发自简书App

从物品的角度来讲,大部分物品也有被挖掘的需要,Chris Anderson 在2004年发表了长尾理论,在互联网时代下,这部分长尾商品也能带来巨大的利润,因为这些商品也许会满足一小部分用户的需求。

所以还是很有必要去挖掘这部分内容的,这时就利用到了推荐系统来对用户进行个性化推荐。

二.推荐系统评测

优秀的推荐系统,可以让多方共赢。

预测准确度是推荐系统领域的重要指标,准确的预测并不代表好的推荐。

对于用户来说,他会觉得这个推荐结果很不新颖。优秀的推荐系统不仅仅能够准确预测用户的行为,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣的内容

那我们如何测量推荐系统的质量

有三种方法

1.离线实验

这个方法比较像我们做模型的时候在线下建立测试集给模型进行打分预测

优点:应用成本低

缺点:结果不准确缺少关联,无法得到真实的线上效果

2.用户调查

更像我们做的调查问卷

优点:可以获得更主观的指标

缺点: 无法组织大规模的测试用户

3.ABtest

也是我们经常用到的AB测在线测试方法

用户通过流量分配系统进入到不同的推荐系统中,生成的数据进入到评测系统产生实验报告

优点:可以公平获得不同算法实际在线时的性能指标,包括商业上关注的指标;

缺点:周期较长,必须进行长期的实验才能得到可靠的结果;


三.推荐数据来源

1. 来源一 利用用户信息

用户行为数据一般存于日志中。

用户行为可以分为:显性反馈行为和隐性反馈行为。

显性反馈:用户明确表示对物品喜好的行为

隐性反馈:指不能明确反映用户喜好的行为(更多的是一种浏览行为)


2.来源二 利用用户标签数据

推荐系统的目的是联系用户的兴趣和物品,这种联系需要依赖不同的媒介。目前流行的有3种方式:物品、用户、特征。

前两种我们都很熟悉,特征有不同的表现形式,可以是物品的属性集合,可以是隐语义向量,这里我们用标签表示。


3.来源三 利用上下文信息

1) 时间上下文信息

时间对用户兴趣的影响:用户兴趣是变化的

,物品也是有生命周期的。

用户兴趣是不断变化的,其变化体现在用户不断增加的新行为中。

一个实时的推荐系统需要能够实时响应用户新的行为,让推荐列表不断变化,从而满足用户不断变化的兴趣。

2)地点上下文信息

用户兴趣和地点相关的两种特征:

兴趣本地化,不同地方的用户兴趣存在着很大的差别,不同国家和地区用户的兴趣存在着一定的差异性。
活动本地化,一个用户往往在附近的地区活动。

因此,在基于位置的推荐中我们需要考虑推荐地点和用户当前地点的距离,不能给用户推荐太远的地方。


4.来源四 利用社交网络数据

获取社交网络数据的途径

电子邮件(邮箱后缀)

用户注册信息(用户生日性别等等)

论坛和讨论组(给人进行分组,相同兴趣)

地理位置信息(需要手授权)

社交网站(社交信息,点赞,好友列表)

相信,读完全文的你,对推荐系统已经有一个初步了解了。预知更多,强推<推荐系统实践>

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容

  • 这篇文章的技术难度会低一些,主要是对推荐系统所涉及到的各部分内容进行介绍,以及给出一些推荐系统的常用算法,比起技术...
    我偏笑_NSNirvana阅读 12,074评论 5 89
  • 作者 | HCY崇远 01 前言 本文源自于前阵子连续更新的推荐系统系列,前段时间给朋友整理一个关于推荐系统相关的...
    daos阅读 5,655评论 0 77
  • 太长不读版:由推荐系统带来的推荐服务基本上已经渗透到我们生活的方方面面,本文作为浅谈推荐系统的基础篇,主要从下面几...
    stayrascal阅读 31,568评论 5 60
  • 作者:项亮出版日期:2012.06 随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这...
    新星_点灯阅读 1,633评论 0 15
  • 在信息过载的今天,推荐系统显得越来越重要。最近在公司开始做推荐系统的项目,也翻阅了一些资料。《推荐系统实践》一书虽...
    阿甘run阅读 745评论 0 2