读书笔记 | 内容算法

最近读了《内容算法》这本书，其中关于推荐算法原理的部分个人觉得讲的比较深入浅出，很适合我等小白作为入门来读。

本书内容主要分为两部分，前半部分关于个性化推荐的应用，以及推荐引擎实现原理；后半部分主要针对自媒体如何把握技术契机自我提升（这部分其实木有细看）

在此整理一下干货

一、推荐系统背景

在推荐系统没有大规模应用于内容分发之前，人们更多的使用搜索的方式来获取信息。

传统搜索引擎模式下，互联网数据量的爆发增长，也给用户快速获取有效信息带来更高成本。由此，致力于“知己知彼”的推荐系统应运而生。

千人千面的个性化信息推荐，多触角的交互带来更精准的信息匹配体验。用户在自然的人机交互中留痕，塑造个人画像，为喜欢的世界投票。

二、推荐系统架构初探

从工程角度来看，推荐系统的架构与搜索系统的架构具有一定的相似度：二者实现的都是信息与用户意图之间的匹配。

而差异在于：

搜索模式下，需要用户提供明确的意图（查询词），以获取到准确的匹配结果；

推荐模式下，即使表意不明确，也往往可以通过获取用户背景的多方位信息，来对意图进行补齐。

我们可以将推荐问题极度简化：当我们能获取到用户的唯一线索仅为“NBA”，那么推荐引擎给用户的结果就可以近似等于搜索引擎在“NBA”这个词下的搜索结果。

我们由此开始梳理：搜索引擎的架构是什么样的？

2.1 搜索系统的架构

我们通常将搜索系统划分为离线和在线两个部分

离线部分：专注于内容的搜集和处理。搜索引擎的爬虫系统会从海量网站上抓取原始内容，并针对搜索系统的不同要求建立不同的索引体系。

在线部分：负责响应用户的搜索请求，完成内容的筛选和排序，并最终把结果返回给用户。

2.2 推荐系统的架构

以搜索系统为基础，来理解推荐系统

离线部分：通过各种方式获取待推荐的内容（如用户提交、协议同步、数据库导入等）；

在线部分：量化用户的请求，完成内容的筛选和排序。

总结一下两者核心区别：

1）我们刚才提到，搜索系统与推荐系统最大的差别在于：用户表意是否明确。因此推荐系统需要尽可能完善用户的长期画像（感兴趣的领域）和短期场景（时间、地点信息）；这样才能在用户每一次请求时更好的揣摩用户当下的意图，以进行后续的内容匹配。

2）在搜索系统中，用户的点击行为会为内容的权威性投票，而在推荐系统中，用户的行为不仅像在搜索系统中那样具有针对内容价值的群体评估意义，而且还具有针对自身画像的个体进化意义。

三、推荐系统原理

3.1 推荐的起点：

更好的了解待推荐的内容，更好的了解要推荐给的人，从而高效的完成内容与人的连接。

断物：

1.内容标签化：适用于文字表义歧义小，可以枚举的类型；标签来源：专家系统产出；用户主动产出

2.信息聚类：适用于标准难界定，难以以规则枚举的场景

识人：

给人贴标签，塑造用户画像

静态画像：用户独立于产品之外的属性，如性别、学历、年龄等

动态画像：用户在产品场景中所产生的显示或隐式行为，如点赞、评论、分享

3.2推荐算法

图片发自简书App

总结：

个性化推荐的具体应用，随着应用场景的不同，推荐策略也会有区分。在实际项目中我们遇到的使用需求：

1. APP的不同主题页，如首页推荐区，活动专题页推荐，产品详情页相似产品推荐，支付成功页产品推荐等。根据页面主题的不同，需要去探究用户需求的差异，从而采取不同推荐策略

2. 产品搜索结果页排序优化

结合用户属性及浏览日志，对排序进行适度优化

3.智能客服机器人产品推荐

这个话题又可以展开新的一篇，还在需求分析阶段，简单谈一下。结合用户问题的意图识别，确定用户需要购买的产品类型，通过多轮对话引导，逐步剖析用户购买需求，并进行合适的产品推荐。

相比于搜索结果的优化展示，机器人推荐的难点在于，推荐结果显示篇幅有限，因此意图理解的全面性，及偏好引导的准确性非常重要

4. 其他应用

网站主动的营销推送，如专题活动推荐，edm宣传等

最后编辑于：2018.12.13 14:30:38

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,547评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,399评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,428评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,599评论 1赞 274
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,612评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,577评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,941评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,603评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,852评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,605评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,693评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,375评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,955评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,936评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,172评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,970评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,414评论 2赞 342

读书笔记 | 内容算法

一、推荐系统背景

二、推荐系统架构初探

三、推荐系统原理

推荐阅读更多精彩内容