承接上一篇SEO基础之搜索引擎运作原理中关于索引与排名的影响因素的了解需求,这里先谈一下对搜索引擎友好的设计与开发方面的基础知识。其实这里罗列的也就是影响搜索引擎的收录的因素,收录是后面索引与排名的基础,所以也是很有必要了解的。
一、可供爬虫爬行的内容
1)最重要的内容需要以HTML形式呈现,类似图片、flash、Java程序等非文本文件内容容易被爬虫忽略或者认为不重要。
2)对于其他非文本形式有如下建议:
A、设置图片的Alt属性
B、使用导航和可抓取链接来补充搜索框
C、用页面上的文本对Java或者flash进行补充
D、如果希望视频和音频被爬虫爬行,可以提供视频和音频的脚本
二、可爬链接结构
以下几种形式不能被爬行到:
1、需要提交的表格
2、无法解析链接的JavaScript
3、被Meta
robots或者robots.txt屏蔽的链接
4、Frames和iFrames(不确定,但是慎用)
5、搜索框
6、Flash,Java,或者其他弹出中的链接
7、链接到的页面上带有成百上千链接
三、关键字
1、关键字密度的说法没有太大意义,因为不能表明关键字与页面的相关性
2、关键字滥用也没有任何意义
四、页面优化的几条建议:
1、Title tags(页面的标题元素是对页面内容的准确,简洁的描述。 对用户体验和搜索引擎优化至关重要。):
1) 并确保title的长度在65-75个字符以内,因为包括搜索引擎和社交媒体通常只显示前面的这些有限字符数内容
2)把重要的关键字放在前面;
3) 包含品牌词,起到提高品牌知名度的作用;
4) 一定要考虑可读性等读者体验,这强调了SEO不仅涉及到优化和战略关键字的使用,还涉及整个用户体验。
2、Meta tags:
元标签最初是作为网站内容信息的代理。
Meta tags种类:
1)Meta Robots
2)X-Robots-Tag(用在非HTML文件上)
3、Meta Description
元描述标记作为页面内容的简短描述存在。 搜索引擎不使用此标记中的关键字或短语进行排名,但元描述是结果中列表下方显示的文字片段的主要来源。
1)可以吸引搜索用户点击到网站,因而撰写吸引人的描述,对于提高点击率非常重要。
2)长度限定在160个字符以内表述清楚页面内容
4、Meta keywords、Meta refresh、Meta Revisit-after、Meta content-type and others不是非常重要
5、URL
1)越短越好
2)包含关键字很重要,但是不能滥用
3)最好的URL是人类可读的,没有很多参数,数字和符号。
4)用连字符分隔单词,类似+,_,空格尽量避免,因为有些搜索引擎无法识别
6、重复内容和规范标签
1)重复内容会被搜素引擎分配非常低的的权重
2)解决的办法是做301定向,告诉搜索引擎这些重复内容页面是同一个页面,规范标签也是同样作用
7、Rich Snippets
虽然使用丰富的代码段和结构化数据不是搜索引擎友好设计的必要元素,但其日益增长的采用意味着使用它的网站管理员在某些情况下可能享有优势。
8、对付内容剽窃的方法之一
在内容中用绝对链接代替相对链接,这样会使剽窃者的内容指向你的网站,增强其原创性的权重。