今日头条的推荐机制,怎么可以推荐更多人呢?

机器能聪明地将文章精准地推荐给可能感兴趣的用户,是因为它既能「读懂」文章在讲什么,又能「猜出」用户想看到什么。

一、机器是怎样理解你的文章的?

在门户网站和传统新闻客户端上,哪些文章能上首页是由编辑们决定的,编辑们会在阅读完文章后,会决定是否将其推上版面。因为每个用户看到的页面都是相同的,编辑们的工作量虽然大,但还能够应付。

而在今日头条客户端上,每位用户的信息流都是完全不同的,如果5亿用户的信息流都交由编辑来推荐,则是一件不可能完成的任务。

但是机器可以做到,因为其「阅读」文章的方式,在速度上要远远胜过人类。

系统会对文章进行特征识别,从而判断文章讲的是什么类型和领域的内容。特征识别的维度有很多,在这里我们重点解释「关键词」。

系统会根据文章中出现的频率,提取出一些词语作为关键词,关键词的判定原则有二:

• 词频高:如一篇体育类文章内容关于某场足球比赛,那么文章可能会出现的高频词就包括球员名字、足球术语或技巧等,如「C 罗」、「射门」、「突破」。

• 同类文章中出现次数少:作者撰文时常用到的虚词、转折词等出现频率也很高,但它们不会作为关键词被提取出来,因为这些词在文章中是普遍存在的。

系统判定出一篇文章的关键词后,会将这些关键词与文章分类模型进行比对,命中哪些分类词库关键词的比例大,文章即被打上该分类的标签。如,一篇文章排名靠前的关键词为「C 罗」、「射门」、「西甲」、「马德里」,那么该篇文章可能会被打上「足球」、「国际足球」、「西班牙」等标签。机器便是这样,完成对文章的初步认知。

因为这种关键词识别机制的存在,作者应尽量避免在文中过度使用非常规词语,如活久见、腿玩年、城会玩等,给自己的文章增加理解障碍。行文用词规范,机器可能更懂你的文章。

除文章正文关键词识别外,机器还会对标题进行关键词的识别和分类比对。因此,在标题中露出具代表性的实体词,可帮助机器理解你的文章。例如,同样一篇足球类文章,标题「大胡子梅西,大胡子阿奎罗,大胡子伊瓜因,阿根廷美洲杯冠军稳了!」,就比标题「三人蓄须明志,誓要实现多年远大理想」含义更明确,更利于系统识别,获得更多的推荐量。

二、你的文章会被推荐给哪些用户?

每个人的阅读兴趣都是大不相同的,个性化推荐机制要做的事情就是——让每位用户看到可能感兴趣的内容,这也是用户每天会「沉迷」在今日头条上的原因。

因此反过来,作者创作的内容也就只会被推荐给可能对它感兴趣的用户。比如,某一篇关于C罗的足球文章写得极出色,阅读量超过了100万,放在朋友圈是可以刷屏的爆款文章,但对足球毫无兴趣的用户在今日头条上仍然是看不到这篇文章的。

这种精准推荐,是建立在机器对每位用户都有充分认知的前提下的。在机器中,每位用户实际是由大量数据构成的,用户的阅读兴趣就藏在这些数据中。

不同数据对用户兴趣计算所占权重不同,数据包括:

• 用户的基本信息

 性别、年龄、所处地理位置(城市或地区);

 使用机型、授权账户(如微博、微信等)、手机上经常使用的其他 App 等;

• 用户主动订阅或喜欢的内容

 订阅帐号;

 订阅频道;

 关注的话题;

• 机器通过计算得出的用户阅读兴趣

 用户阅读过的文章分类和关键词;

 用户聚类:相似类型用户还喜欢阅读的其他文章类型;

 用户在今日头条客户端主动标记「不感兴趣」的实体词或文章类型;

根据以上数据,系统对用户的阅读兴趣就能有个基本的判断。一般来讲,用户使用产品时间越长,系统积累的阅读数据越多,对其兴趣的判断也就越准确。使用产品的用户越多,系统对用户聚类的判断也越准确。

通过对数据的处理,每位用户将被机器打上各种标签,如一个用户阅读的文章中关键词排名靠前的是:C 罗、皇家马德里、欧洲杯、小米、魅族、苹果。那么,这位用户可能被打上「足球」、「皇马」、「科技」、「手机」、「米粉」等标签。不同的用户会被打上不同的标签。

当一篇带有「C 罗」、「足球」标签的文章在进行推荐时,系统会将其自动匹配给带有「C 罗」或「足球」标签的用户,这便是推荐引擎的个性化推荐。当然,系统推荐的实际情况会远比这复杂得多,但推荐的基本原理便是,机器通过数据来理解文章和用户,并对两者进行匹配。

三、你的文章是如何被被推荐的?

为让受欢迎的内容被更多用户看到,不受欢迎的内容不占用过多推荐资源。头条号文章在推荐时,会分批次推荐给对其感兴趣的用户。

如何理解分批次推荐呢?文章首先会被推荐给一批对其最可能感兴趣的用户(这批用户的阅读标签与文章标签重合度最高,被系统认定最可能对该文章感兴趣。),这批用户产生的阅读数据,将对文章下一次的推荐起到决定性作用。数据包括点击率、收藏数、评论数、转发数、读完率,页面停留时间等,其中,点击率占的权重最高。

这很好理解,能吸引众多用户点击的文章自然会被认为更可能是好文章。

延伸阅读:

扩大推荐机制(注意:以下举例仅用于说明点击率对文章推荐的影响,不代表实际推荐情况)

文章的首次推荐,如果点击率低,系统认为文章不适合推荐给更多的用户,会减少二次推荐的推荐量;如果点击率高,系统则认为文章受用户喜欢,将进一步增加推荐量。以此类推,文章新一次的推荐量都以上一次推荐的点击率为依据。此外,文章过了时效期后,推荐量将明显衰减,时效期节点通常为24小时、72小时和一周。

例如,一篇文章首次推荐给了1000个用户,如果这批用户的点击率较高,系统判定用户非常喜欢这篇文章,将其扩大推荐给10000个用户,如果这轮推荐用户的点击率仍然维持在较高水平,那么系统会将文章再次扩大推荐给30000个用户、50000个用户、100000个用户 ••••••推荐量和阅读量便如滚雪球一般节节攀升。直到文章过了24小时时效期,新一轮推荐的推荐量才会逐渐衰减。

因为这种扩大推荐的机制,作者想获得更多的阅读量,就必须努力把各维度阅读数据(点击率、用户阅读时间、收藏数、评论数、转发数等)维持在高位水平。这就要求文章:

• 标题和封面图具有足够的吸引力、表意清晰(提高点击率)

• 图文并茂,易读性强(提高用户阅读时间)

• 内容详实,给读者干货般的充实感(提高收藏数和用户阅读时间)

• 观点鲜明,引发读者讨论(增加评论数和转发数)

其中,至关重要的当然是点击率,也因此,标题和封面图的重要性便不言而喻。这也是今天注意力稀缺时代,文章获得好的传播的关键要素。

有吸引力的标题能带来更多点击,但这不意味作者要成为惯用夸张标题的标题党。恰恰相反,标题党反而会被平台通过技术手段(标题党模型等)识别和打压,限制推荐量。

除了标题夸张,用户举报密集、负面评论过多、无效异常点击、时效期已过都是限制文章推荐量的因素。

四、为什么会产生推荐效果不好的情况?

常有作者抱怨自己的某篇文章推荐效果不好,或者对自己的文章阅读量不稳定感到焦虑。文章的阅读量由系统推荐量直接决定,而推荐量又取决于上一轮推荐的点击率。因此单篇文章推荐效果不好,原因无外乎三类:点击率低、推荐量低、阅读量低。

1.点击率低

我们知道,低质内容对用户阅读体验会有负面影响。为了提升用户体验,机器会减少那些不受欢迎的内容(即点击率低的内容)的展示量,如果点击率持续走低,展示量也相应地持续减少。

一般来说,如果初次点击率不高,就很难再有较高的展示量和阅读量。点击率较低可能是如下原因导致:

• 帐号内容垂直度较低,没有及时推荐给相应的用户

假使一帐号是体育类帐号,这一次却发表了娱乐类内容。对于这种不属于帐号擅长领域的文章,机器需要重新识别分类再进行推荐,这在一定程度上会延长推荐时间,不能保证在规定时效内,推荐给相应的用户。因此,作者若想保证较高水平的点击率,坚持创作垂直内容是极有必要的。

• 文章内容自身问题,导致点击率低

1. 标题平淡,没有起到吸引读者阅读的作用

2. 配图无吸引力,文章配图与内容相关度不高,或者前三张图片质量较差

3. 内容过于低质,引起读者反感甚至投诉

2.推荐量低

推荐量是决定阅读量大小的重要因素,推荐量低的主要原因有:

• 点击率过低

• 潜在的用户群过小,推荐量不高

如果帐号潜在的用户群实在过小,机器将很难挖掘到**户,推荐量自然高不了。而**户群过小有如下原因:

1. 话题过于冷门、生僻

2. 涉及领域过于专业,晦涩难懂,与主流群众有一定距离

• 内容供过于求

同一领域或话题相似内容过多,出现了供过于求的现象。如,关于当下热点话题的谈论,受众虽然足够多,但是内容供给总量实在庞大,相应地每一篇内容得到的推荐量也就比较少。

• 消重机制会影响推荐量

文章非原创或者没有在头条号首先发布,文章可能会被消重,从而影响推荐量,可详见消重部分。

• 时效短

时效性短的文章,实际推荐时间自然也短,而短时间内可能将无法获得较多的推荐量。

• 审核中被拦截,内容不被系统推荐,可详见文章审核部分。

3.阅读量低

文章阅读量低,与点击率和推荐量有关。

• 推荐量低

在推荐量增长到一定数量级之前,即使点击率较高,文章阅读量也不会高,因为内容并没有得到大范围的验证。在后续的推荐中,如果推荐量持续攀升,阅读量可能会稳步增长。

• 点击率低

如果推荐量已经足够高,阅读量仍然较低,很可能是由于文章的点击率较低。这就需要从帐号和文章出发,坚持发布垂直类内容,努力提

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容