40《内容算法》| 文章阅读量很低?原来是没通过“冷启动”这一关

漫游第40篇读书笔记

创作的繁荣、载体的多元、分发的进化,内容信息消费在快速的发展和迭代过程中,但一定有可以让我们慢下来的东西——那是内容的核。——闫泽华


大家好,我是漫游。

今天和您分享的是《内容算法:把内容变成价值的效率系统》,作者闫泽华。

什么是内容推荐算法?

“信息茧房”是算法之过吗?

为什么你的文章阅读量很低?


关于本书

信息爆炸的时代,我们每一个人都是内容的消费者。打开手机APP,为什么你看到的是体坛赛况,而我看到的是影视娱乐?为什么别人的文章阅读量10万+,而我的只有几十个?这背后是内容推荐系统的匹配与算法分发结果。

我们大多数人并不了解推荐算法的运作逻辑,因此多少都会心存成见与误解,比如标题党、内容Low、信息茧房等等。本书作者具有互联网从业者和自媒体创作者双重从业经验,通过产品经理、自媒体两个角度,他为外行人系统介绍了内容推荐的系统架构、算法迭代、平台应用,以及自媒体的变现与发展路径。

断物识人:内容推荐算法的起点

互联网经历了一个从“人找信息”到“信息找人”的转变,内容的分发也从搜索系统进化到推荐系统。这两者的系统架构有相似之处,都是要实现信息与用户意图之间的匹配;不同之处在于搜索系统中,用户意图能够借由“关键词”明确表达,而推荐系统中没有。

推荐是特定场景下人和信息更有效率的连接。首先算法系统要对内容、对用户进行识别,作者用“物以类聚,人以群分”描述这个过程,最简单的识别方式就是“贴标签”

标签是我们对多维事物的降维理解,抽象出事物更具有表意性、更为显著的特点。不同于分类的树状体系,标签是网状的,而且灵活性强,既可以通过平台的专家系统产出,也能够依靠普通网友生成。

对于内容,以音乐网站为例,可以按照流行、古典、民族、摇滚、民谣等流派标签进行识别,还可以依据跑步、自习、睡眠等场景标签进行区分。对标签难以准确表意和概括的领域,算法系统会通过聚类的方式进行描述,以便对内容进行准确识别。

对人的识别是“用户画像”,更直白说就是给目标用户贴标签的过程。我们填写的注册信息,搜索输入的每一个关键词,每一次的点击和观看习惯,以及点赞、收藏、评论和转发,都是系统中用户画像数据的来源。

内容和用户的识别只是开始,更重要的是物与人的匹配。

内容分发:连接内容与人

内容分发的方式主要有三种:编辑(中心人工主导)分发、算法(机器主导)分发、社交(离散人工主导)分发,三种方式各有千秋。

编辑分发的优势在于依靠编辑的专业性,完成从海量内容到有限展示位的过滤和筛选,内容的平均质量相对较高。但人工的判断难免出现偏差,“叫好不叫座”的情况时有发生。

算法分发的引入,实现了“千人千面”的效果,展示位数量得到极大扩展。现实中,平台采用人工+机器的分发方式,内容审查、质量评估、推送范围、推送级别等环节仍然依靠编辑和审核团队的把控与决策。

社交媒体广泛应用后,内容的分发逐渐去中心化,每一个人都成为编辑,成了内容分发的中心。但社交分发也出现新的问题,比如流量逐渐被大V、营销号垄断,流量获取的成本剧增;内容质量逐渐下降,朋友圈一度充斥着各种微商广告、转发集赞、打卡/晒娃贴。

各大平台也因此不断升级各自的分发算法,通过调整各影响因素的不同权重,优化内容排序,对低质或过度传播的信息进行降频过滤等等手段,实现匹配效率和质量的优化,从而提升用户的使用体验。

算法是基于我们对现实世界的理解进行的抽象和建模,编辑、社交因素都可以转化为算法推荐的参考因素。从这个角度看,算法分发可以说是内容分发的终极解决方案。

现实中,各平台采用多分发融合的模式:依赖中心化编辑引导和干预,依靠去中心化用户生产传播,应用机器学习提升效率。对此,作者的观点是:多分发方式的融合一定是未来分发的主流。

信息茧房:推荐算法不背这个锅

当前内容分发全面进入推荐分发时代,然而现实中,舆论却时不时对其口诛笔伐,比如公众对于标题党的抱怨,对身处“信息茧房”的担忧。但作者指出,推荐算法不该背这个锅。

标题党是最近才出现的吗?其实不然,标题党的鼻祖可追溯至1985年出版的《知音》。作者列举了几个知音文章的标题,其中之一是《再大的恨放下吧,唤醒前夫赢得亲情一片天》(2007年第35期)。品一品,是不是熟悉的味道?

在大量依赖政府拨款补贴的期刊中,《知音》依靠零售市场自负盈亏,一度成为全球前五强的大刊,发行量常年稳居中国杂志发行第一,月销量一度达到700万份。

“信息茧房”一词来自于哈佛大学法学院教授、美国前总统奥巴马的法律顾问凯斯·桑斯坦2006年的著作《信息乌托邦——众人如何生产知识》。 桑斯坦在书中指出:在信息传播中,由于公众对自身的信息需求并非全面,公众只注意自己选择的东西和使自己愉悦的领域,久而久之,会将自身桎梏于像蚕茧一般的“茧房”之中。

纸媒时代,我们同样根据个人喜好来订阅报纸和期刊,有人读《知音》,有人看《人民日报》,它们也构成一个个“茧房”。不论是纸媒时代的销量,还是网媒时代的阅读量,都是用户主动选择的结果。

推荐系统是一个会极度放大优缺点的系统,因此也极大地放大了我们对信息茧房的担忧情绪。但正如书中所言,就算你跳得出算法分发,也跳不出社交分发;跳得出社交分发,也跳不出自己的认知选择边界。“茧房”始终存在,真正过滤你的,是你的认知泡泡。

冷启动:决定一篇内容的命运

什么是冷启动?一篇新内容对推荐系统来说是完全陌生的,系统需要收集一定的曝光量和互动量(阅读、评论、分享等)等基础数据来进行后续的推荐。通过探索性展示,推荐系统完成从0到1基础数据的积累过程,这就是冷启动,其效果的好坏直接关系到后续的分发推荐。

在冷启动过程中,如果内容没能得到足够的正面反馈(点击、阅读、互动),系统就会认为这个内容是不受欢迎的,为了控制负面影响,会逐步降低推荐量,也即冷启动失败;反之,内容会被推荐系统快速放大,推荐量逐步提升,就可能成为爆款。于是有了“冷启动决定一篇内容的命运”的说法。

通过前文,不难理解内容推荐流程中存在两个关键节点:一是系统能够准确识别;二是成功通过冷启动。各平台给自媒体小白的新手教程里,都会提到两个重要因素:标题、封面

过机器这关,标题、封面就要易于机器识别和理解,诸如用词避免歧义,使用英文要附中文解释等技巧,需要创作者学习掌握。

对于冷启动的考验,由于“用户只给你1秒钟”,好的标题和封面便是关键。因此作者建议:如果点击率太差,别废话,回炉改封面和标题去。

因为冷启动的关键作用,各平台也开发了一些工具来提高冷启动的成功率,比如双标题、双封面。有数据显示,同样内容在不同标题+封面下,点击率有很大的差异。双标题、双封面就是两次冷启动的机会,创作者要充分利用平台提供的这些功能。

一篇内容既要服务于机器,也要服务于人,只有这样,你的内容才能够在推荐系统中获得良好的分发量。当然,通过冷启动只是第一步,后面还有阅读体验和运营水平的较量。

作者也是一名自媒体从业者,对于自媒体如何运营、如何变现、如何成长进化等话题,他结合案例进行了一一介绍,但限于本书体量,并不深入,权当入门了解。

结语

在《内容算法》中,作者从推荐系统和自媒体两个角度,介绍了内容推荐算法的迭代应用与自媒体的发展。不管是平台从业者、自媒体创作者,还是内容消费者,都能对隐藏在界面背后复杂且精密的内容推荐算法加深了解。

创作的繁荣、载体的多元、分发的进化,内容信息消费在快速的发展和迭代过程中。但正如作者所言,一定有可以让我们慢下来的东西——那是内容的核

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容