协同过滤

> 结论:

协同过滤是电子商务推荐系统的一种主要算法。它能够过滤机器难以自动内容分析的信息,共用其他人的经验,推荐新信息,有效性高。但新用户问题系统开始时推荐质量较差,新项目问题质量取决于历史数据集,具有稀疏性和系统延伸性问题。以记忆为基础的协同过滤技术经过发展演变成以模型为基础。如今在信息过滤和信息系统中迅速成为一项很受欢迎的技术。


> 定义

定义介绍

  1. 百度:协同过滤是利用某兴趣相投、拥有共同经验群之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的记录也相当重要。
  1. 必应:是推荐系统中应用最为广泛的技术之一,它基于一组兴趣相同的用户进行推荐。为用户找到他真正感兴趣的内容的好方法是,首先找他与他兴趣相似的用户,然后将这些用户感兴趣的内容推荐给此客户。
  1. 知乎:协同过滤(Collaborative Filtering)作为推荐算法中最经典的类型,包括在线的协同和离线的过滤两部分。所谓在线协同,就是通过在线数据找到用户可能喜欢的物品,而离线过滤,则是过滤掉一些不值得推荐的数据,比比如推荐值评分低的数据,或者虽然推荐值高但是用户已经购买的数据

小结

  • 我认为百度的定义较好。
  • 虽然百度对协同过滤的定义相对于必应和知乎的有点长,但它更详细地说明了什么是协同过滤以及它的运作方式。而必应以及知乎的解答都是简单地概括为推荐用户其感兴趣的内容,并没有谈及协作这方面的内容。而百度不仅扣中兴趣还点到协同,然后相对于另外两个,更利于人们对它的理解。

> 案例

  1. 国外案例
  • 事例:在亚马逊网络书店中,顾客选择一本自己感兴趣的书籍,马上会在底下看到一行“Customer Who Bought This Iten Also Bought"。

  • 为何值得知道:亚马逊网络书店是最著名的电子商务推荐系统,亚马逊也是全球最大的电子商务公司之一,其历史比我们所熟知的BAT还要早。“根据顾客的兴趣进行推荐服务”是以用户的角度来推荐的协同过滤系统。由于亚马逊网络书店在推荐这一服务上为人津津乐道,各网络书店也跟进了做这样的推荐服务。虽然商业气息浓厚但带给了使用者很大的方便。还有一点,它不仅仅是用于电子商务方面,在我们经常使用的视频网站上也有应用,目的是利用人们对于在智能手机、平板电脑和互联网电视上观看电视节目的兴趣,以扩大自身在流媒体播放服务这一领域中的占有率。

  • 为何符合定义:协同过滤 是由两个方面组成的 一个是在线协同 一个是离线过滤。亚马逊网络书店是在“对同样一本书有兴趣的读者们兴趣的某种程度上相近”的假设前提下提供的这样的推荐。“兴趣在某种程度上相近的读者”则表现出了“在线协同”,“提供书籍推荐服务”则表现出了离线过滤。亚马逊网络书店能对顾客买过的东西进行自动分析,然后因人而异的提出合适的建议。这就是以用户为基础的协同过滤。

  1. 国内案例
  • 事例:豆瓣(douban)是一个社区网站。网站由杨勃(网名“阿北”)[1] 创立于2005年3月6日。该网站以书影音起家,提供关于书籍、电影、音乐等作品的信息,无论描述还是评论都由用户提供(User-generated content,UGC),是Web 2.0网站中具有特色的一个网站。网站还提供书影音推荐、线下同城活动、小组话题交流等多种服务功能,它更像一个集品味系统(读书、电影、音乐)、表达系统(我读、我看、我听)和交流系统(同城、小组、友邻)于一体的创新网络服务,一直致力于帮助都市人群发现生活中有用的事物。

  • 为什么值得我们知道:
    豆瓣是国内做的比较成功的社交网站,它以图书,电影,音乐和同城活动为中心,形成一个多元化的社交网络平台。豆瓣是基于社会化的协同过滤的推荐,这样用户越多,用户的反馈越多,推荐的效果会越来越准确,让用户更好的发现自己的潜在兴趣和需求。

  • 为何符合定义:
    协同过滤包涵两个方面在线协同和离线过滤。豆瓣通过每个用户的收藏和评分来达到推荐的目的,这是在线协同的体现。对于离线过滤,豆瓣就是将用户评价差的产品进行过滤,来为用户提供更好的推荐服务。豆瓣正是通过两者的结合来很好的完成了协同过滤。


>总结

协同过滤作为一种经典的推荐算法种类,在各界应用广泛,它的优点很多,模型通用性强,不需要太多对应数据领域的专业知识,工程实现简单,效果也不错。这些都是它流行的原因。当然,协同过滤也有些难以避免的难题,比如令人头疼的“冷启动”问题,我们没有新用户任何数据的时候,无法较好的为新用户推荐物品。同时也没有考虑情景的差异,比如根据用户所在的场景和用户当前的情绪。当然,也无法得到一些小众的独特喜好

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 227,702评论 6 531
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 98,143评论 3 415
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 175,553评论 0 373
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 62,620评论 1 307
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 71,416评论 6 405
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 54,940评论 1 321
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 43,024评论 3 440
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 42,170评论 0 287
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 48,709评论 1 333
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 40,597评论 3 354
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 42,784评论 1 369
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 38,291评论 5 357
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 44,029评论 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 34,407评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 35,663评论 1 280
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 51,403评论 3 390
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 47,746评论 2 370

推荐阅读更多精彩内容

  • 协同过滤的定义: 协同过滤(英语:Collaborative Filtering)简单来说是利用某兴趣相投、拥有共...
    我爱三杯茶阅读 1,205评论 0 10
  • 协同过滤 协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予...
    你猜_42e0阅读 3,455评论 0 0
  • 什么是协同过滤 协同过滤推荐(Collaborative Filtering recommendation)是在信...
    小灰灰besty阅读 34,429评论 7 51
  • 今天要讲的主要内容是协同过滤,即Collaborative Filtering,简称CF。 Contents 1....
    路洛洛阅读 1,060评论 0 5
  • 亲爱的舟舟: 展信悦!第一次真正意义上给你写信,心里有很多话想要对你说,却又不知从何说起。 那天,...
    会动的树QAQ阅读 498评论 0 0