A.用户相关度
搜索引擎首先需要确保呈现结果与用户的搜索需求紧密相关,这里的相关度包括关键词在网页中出现的位置、频次(密度)。比如,企业官网包含的品牌和产品关键词最多,对于搜索引擎来讲,就是相关度最高的自然搜索结果推荐。
对于构成绝大多数自然搜索结果的资讯内容来说,关键词在正副标题、首段、正文中出现的位置、频次,对搜索引擎的相关度评判会有直接影响。在百度早期,内容与用户相关度的影响在搜索排序中的比重会占到七成。
B.内容时效性
作为互联网动态更新的时效性内容源,搜索引擎会给予新闻网站以较高的权重。如果内容中带有比较明确的时间点信息( 如新闻发生的具体时间),更有机会被搜索引擎作为新鲜的时效性内容抓取,再综合其他各项指标判定索引和推荐。
如果内容紧贴热点,在百度新闻和网页时效性卡片中获得展示的机会越大。百度在2017年3月宣布取消新闻源数据库时,其公告中强调的核心根源就是因为“时效性内容识别技术”的升级。
C.内容质量
所谓内容质量,也就是内容能为用户产生的价值,近年来非常明显的趋势是:
百度正在网页和新闻搜索结果中过滤掉没有时效性,或被算法判定为营销内容的结果,即便是内容发布门户网站上,也不会受到靠前的搜索结果推荐。
百度站方曾接受界面采访时提到:“我们有个部门在过去半年时间内一直在调教算法,针对所有百度抓取到的网页,教机器来判断时效性和内容质量,在前端展示上,一些软文会被过滤掉,其他的不会发生太大变化”。
D.用户参与度
所谓用户参与度,是指构成用户参与的行为有阅读、点击、转评赞等互动行为,这些指标也是构成百度资讯指数的基础。用户对网页内容的参与度越高,搜索引擎认为其重要程度和受欢迎程度越高,页面则更有机会展现给用户。
一般来讲,社交类UGC内容如知乎、豆瓣等,招聘信息、分类信息、电商信息、股市行情等,通常更新频度高,点击量大,搜索结果会靠前,但基本上是非品牌公关目的的功能性作用,如招聘、销售等目的。
新闻网站发布的资讯新闻,新闻价值决定用户参与度,看的人越多,搜索结果推荐越靠前,越靠前用户点击越多,累积循环,这也解释了为什么多年前的负面新闻一直沉淀在百度首页,这就是典型的马太效应。
E.相关网页数量
除了搜索直接访问外,用户可能从其它网页链接的点击访问到内容,通过其它网页产生的关联越多,则更有利于长期的搜索长尾。对于站点来讲,内外链的数量,尤其是外部网页指向页面的锚文本数量、质量等,仍是搜索引擎判定网页价值的指标之一。
F.网页质量
网页的质量包括内容质量、浏览体验、PC和移动端的访问速度,友好程度、能否满足用户的延展需求等。除了对站点的评价之外,百度逐渐强化内容质量的识别评判,综合为内容所在落地页的评价。
尤其在百度取消新闻源数据库后,即使是门户等之前权威的新闻源站点,相同频道的不同质量的内容,获得百度新闻及网页收录的情况也明显不同,被算法综合评判为低质营销目的的软文(非时效性新闻),会被从结果中直接过滤或减少呈现。
G.关键词竞争度
关键词竞争度,是最容易被忽略和不被了解的因素,但恰恰是影响搜索结果排序最重要的隐藏方面。所谓关键词竞争度,也指关键词热度,指该关键词在百度搜索的热度和收录的相关网页、新闻数量。
举个简单例子,某关键词被用户搜索的频次越高,热度就越高,相关网页,新闻收录的数量越大,竞争度越大,也同时意味着新发布的内容,影响百度搜索结果排序的难度就越大。
关键词搜索的网页收录结果越多,该关键词的热度越高,竞争度越大。比如“区块链”这样的行业热词,相关的新闻每天新发布数百篇,累计有6.3万篇,相关的网页收录结果有1700多万个,也就是说如果有新发布的以“区块链”为关键词的内容,要和现有的1700多万个结果进行竞争,经过算法的综合评判后,才有机会上首页。这也解释了为什么一篇新发布的内容并不能马上出现在首页的问题。
来源于网络