R&S | 手把手搞推荐[0]:推荐入门小结

请允许我做个广告,欢迎关注我的个人公众号,CS的陋室,更多有关算法工程,推荐系统,自然语言处理的文章送给你。

自学推荐系统的流程逐渐到达尾声,自己学的内容也逐步完善,门是基本入了,所以打算写一个小系列,在自己的设备、数据条件允许的前提下,把一些关键但是基本的模型给实现一遍。

学习历程

至于为什么想学推荐系统,可以看看我这篇历史文章:技术向:推荐学习推荐系统(深度思考,不是广告)

最开始的学习是想看项亮老师的《推荐系统实践》,相信很多前辈也从这本书里获益匪浅,这本书我是基本看完了,但是感觉意犹未尽,在深度学习如此流行的环境下,推荐系统肯定不止于此,于是砸钱报了一波七月在线的推荐系统课。

七月在线的课吧,其实我一直对这种基本的课没有太高的要求,不希望从课堂上真正学到什么,而是让我知道,我该学什么,这门课肯定是做到的,虽然后续的课程因为很多原因我没有跟上,但是在录屏和PPT的帮助下,我把老师课上说的,以及老师提到的资料都认真看了,我想这才是我最大的收获。

目前的状态是,理论基本都能get,架构也基本理解,甚至有一定能自己弄一个简单的架构的思想萌芽,对整个流程有比较深入的理解,相信这是一个比较重要的里程碑吧,缺的可能是动手吧,在未来很短的一段时间内,我会集中一些精力在一套数据下尝试一些基本的模型。

入门策略建议

我想很多人肯定是想知道我的学习建议,我就来谈一下吧。

首先,恳请各位想入门机器学习的同学,认认真真先把机器学习搞懂,推荐里面大量机器学习、深度学习模型。还有很多有关数据层面、特征层面的工作,所以不要指望算法小白能够直接看懂里面的东西,这点在我看来推荐系统并不友好。

第二,从协同过滤入手,看一些基本的理论,在召回层面了解一些基本的知识,适当情况可以动手实践一下。

第三,排序阶段,从CTR预估之类的典型问题的处理,如LR、FM、FFM系列模型,到wide&deep等,另外是矩阵分解,对ID类特征的处理,借用NLP中embedding的一套深度了解,甚至到一些更前沿的模型,铺开了解并且掌握。

第四,在这些都基本了解的基础上,去看一些企业的经验和case,如我之前写过的Youtube、爱奇艺等,深入了解,看看企业级的是怎么做的,不过放心,他们告诉你的一定是他们基本已经不用的东西,顶多是第一版上线的基线模型,尽管如此,对于新手、从无到有建模而言,已经绰绰有余。

第五,非常建议大家看看论文,尤其是顶会的、著名企业的论文,多去看看学学,这些都是面向实践非常重要的论文;对于学术界,就针对自己的问题去找论文吧,记得最好从顶会下手。

我的学术研究方向不在这块,在NLP,因此推荐系统的学术界了解不如各位大佬那么深,就不继续深说啦。

补充一句,抛开实现谈理论,在这块肯定不可行的,纸上得来终觉浅,绝知此事要躬行,动手敲几行代码吧。

学习材料

很多人问我有什么好的学习材料其实我自己非常头疼,因为我不知道对你来说什么是好的学习材料,也不知道你的基础怎么样,直接给你佛朗西斯科的你可能要捶我对吧,虽说现在推荐系统还在开荒阶段,学习资源少,但是从百度等完了过去到终究是找得到资源的。

无差别的,我说几个比较建议大家看的材料吧。

书籍

  • 《推荐系统实践》,项亮。以协同过滤为基点去写的书,对实际业务也有很多独到的理解,冷启动等,说的很清楚,适合对背景不太熟悉的同学。
  • 《推荐系统-技术、评估及高效算法》,弗朗西斯科等。推荐系统界的算法导论,我就说到这吧,见仁见智。
  • 《推荐系统与深度学习》,清华大学出版社那本。在书里面,讲的可以说非常前沿了,对一些具体问题怎么处理讲的十分详细,还有代码,基线模型基本都有了,可以参考。
  • 《计算广告》,刘鹏等。这本书业内也非常出名,对广告领域、推荐领域的很多问题都说的很详细,甚至是和产品等有关工作者看。
  • 《用户网络行为画像》,牛文佳等。简单提到推荐系统,但是在推荐系统这种面向用户、复杂特征的问题,还是非常适用的。

多说无益,重要的是看完吧。

其他材料

说到课,别的没上过,七月在线的推荐系统课还算合适,说不定你们还能在群里看到我哈哈哈(别加我QQ,基本不用),不过提醒,指望一门课几十个小时就把你讲懂了都会了,做梦,自己去认真看老师给的材料,自己动手做,才会有搜获,别整天等着别人把东西往你的嘴里喂。这门课,基本知识在我的视角下都讲到了。(没收广告费)

论文吧,经典论文多看看,上面提到了此处不赘述。

我打算写什么

这个系列归属于我【R&S】专栏里面,当然是写怎么搞推荐系统,那我具体想些什么呢。

  • 既然手把手,肯定是写一些实操性的东西了。
  • 数据探索与基本的数据分析,这是很容易忽略但是却非常重要的工作,也有人问我数据探索怎么做,我就简单操作一次吧。
  • 一些偏向机器学习、深度学习模型吧,LR、FM等的尝试,一些关键的模型吧,都尝试尝试,看看综合性能有什么差别。
  • 一些特征工程方法,看看性能提升量,以及具体操作细节,one-hot化、embedding等。
  • 有些可能对数据要求比较高的,可能干不了,设备和数据本身不允许,可以尝试吧。

到这里吧,本系列下一篇是有关数据探索和数据介绍的内容,后续系列主要是用movielens中的ml-1m的数据,有兴趣的可以去了解一下。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,185评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,652评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,524评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,339评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,387评论 6 391
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,287评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,130评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,985评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,420评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,617评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,779评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,477评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,088评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,716评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,857评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,876评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,700评论 2 354

推荐阅读更多精彩内容

  • 计划到底有没有用? 有人说,计划没什么用,原因实行时你总能遇到你想不到的问题,让你不得不调整,最终,大部分时候你都...
    小蓝的练习本阅读 66评论 0 0
  • 看到高中那会喜欢的男孩子现在都长成了大叔模样也都成家立业了心里也不知道是什么滋味。会有一种时过境迁的沧桑感吧。 虽...
    吐槽女与苹果糖阅读 151评论 0 1
  • 这几天不知为何,公公对我直呼全名,有种生疏的客气,我稍有不爽。转念一想,为何他会如此称呼?应该与我自己有关系,别人...
    山河万朵阅读 1,705评论 0 1
  • 日子开始清瘦 开始憔悴…… 在我枯萎以后 或是,在你离开以后 我在某个夜里 悄悄地开放 在你的身旁 我并不招摇 可...
    差点成绅士阅读 407评论 3 4
  • 充实的3天一晃即过,满满的收获和能量。 培训完快速地铁回家,再次检查出差两周的物品是否带齐,昨晚画了简单的思维导图...
    天地蓝阅读 219评论 0 0