关于收录问题分三个部分:
要解决收录的问题,
一、收录的标准
首先 ,我们要掌握收录标准的三个维度进行讲述的,在这个地方我们一定要记住一个点,所谓的收录标准,它不是真的有一个评判的依据摆在那个地方,我们按照那个东西去打分,不是这样的,收录标准他和搜索引擎有关,百度,360,谷歌各有不同。
网站网页的不同,同一文章它发在人民网会收录,发在自己的一个企业网,会收录么?
一个搜索引擎是否收录一个网页,它从三个方面进行查看,综合评分。
第一维度:内容质量
《百度网页质量白皮书》《360网页质量白皮书》
帮助我们了解网页内容质量的评判标准
网页主体内容是网页的价值所在,是满足用户需求的前提基础。百度搜索引擎评价网页内容质量主要看其主体内容的好坏,以及主体内容是否可以让用户满意。 不同类型网页的主体内容不同,百度搜索引擎判断不同网页的内容价值时,需要关注的点也有区别,如: • 首页:导航链接和推荐内容是否清晰、有效。
• 文章页:能否提供清晰完整的内容,图文并茂更佳。
• 商品页:是否提供了完整真实的商品信息和有效的购买入口。
• 问答页:是否提供了有参考价值的答案。
• 下载页:是否提供下载入口,是否有权限限制,资源是否有效。
• 文档页:是否可供用户阅读,是否有权限限制。
• 搜索结果页:搜索出来的结果是否与标题相关。
百度搜索引擎考量网页内容质量的维度非常多,最为重要的是:成本;内容完整;信息真实有效以及安全。下面我们通过举例来感受一下百度搜索引擎是如何对网页的内容质量进行分类的,请站长对比自己站点的页面,站在搜索引擎和用户的角度为自己打分:
内容质量好: 百度搜索引擎认为内容质量好的网页,花费了较多时间和精力编辑,倾注了编者的经验和专业知识;内容清晰、完整且丰富;资源有效且优质;信息真实有效;安全无毒;不含任何作弊行为和意图,对用户有较强的正收益。对这部分网页,百度搜索引擎会提高其展现在用户面前的机率。
例如:
• 专业医疗机构发布的内容丰富的医疗专题页面;
• 资深工程师发布的完整解决某个技术问题的专业文章;
• 专业视频网站上,播放清晰流畅的正版电影或影视全集页面;
• 知名B2C网站上,一个完整有效的商品购买页;
• 权威新闻站原创或经过编辑整理的热点新闻报道;
• 经过网友认真编辑,内容丰富的词条;
• 问答网站内,回答的内容可以完美解决提问者的问题。
第二维度:可访问性
不同质量的网页带给用户的浏览体验会有很大差距,一个优质的网页给用户的浏览体验应该是正向的。用户希望看到干净、易阅读的网页,排版混乱、广告过多会影响用户对网页主体内容的获取。在百度搜索引擎网页质量体系中,用户对网页主体内容的获取成本与浏览体验呈反比,即获取成本越高,浏览体验越低。面对内容质量相近的网页,浏览体验佳者更容易获得更高的排位,而对于浏览体验差的网页,百度搜索引擎会视情况降低其展现的机率甚至拒绝收录。
影响用户浏览体验好坏的因素很多,目前百度搜索引擎主要从内容排版、广告影响两方面对网页进行考量:
内容排版:用户进入网页第一眼看到的就是内容排版,排版决定了用户对网页的第一印象,也决定了用户对内容获取的成本。
广告影响:百度搜索引擎理解网站的生存发展需要资金支持,对网页上放置正当广告持支持态度。网页应该以满足用户需求为主旨,最佳状态即“主体内容与广告一起满足用户需求,内容为主,广告为辅”,而不应让广告成为网页主体。
下面我们通过举例来感受一下百度搜索引擎是如何对网页的浏览体验进行分类的,站长可以据此对比检验自己站点的浏览体验如何:
页面布局合理,用户获取主体内容成本低,一般具有以下特征:
• 排版合理,版式美观,易于阅读和浏览;
• 用户需要的内容占据网页最重要位置;
• 能够通过页面标签或页面布局十分清楚地区分出哪些是广告;
• 广告不抢占主体内容位置,不阻碍用户对主要内容的获取;
第三维度:页面权威性
当一个页面不收录的时候,我们给他增加一个外链,指向几个内链,同一文章它发在人民网会收录,发在自己的一个企业网,这就是页面权威性维度问题。
二、新站收录异常如何解决
1、Robots封禁
2、蜘蛛是否抓取
3、细节问题
4、增加外链
三、老站收录异常如何解决
1、服务器问题(稳定、更换IP等)
2、蜘蛛访问轨迹
3、提升内容质量
引发收录异常通常是
1、URL参数问题
2、混乱的网站结构
3、页面的冗余代码过多
4、链接使用js
5、Robors封禁
6、蜘蛛抓取异常
7、服务器问题
8、内容质量评分下降
9、更换IP或网站改版
我们总结一下:
首先我们要知道收录的标准是什么;
其次是怎么解决新站的收录问题;
然后是怎么解决老站的收录问题。
只要我们能掌握今天所讲的内容,那么所有的收录问题,都将不是问题,甚至你还可以帮其他人诊断他遇到的网站收录问题。