搜索引擎工作原理简介
搜索引擎工作过程大体上可以分为三个阶段:
爬行抓取--预处理--排名
1.爬行和抓取
1.1蜘蛛
搜索引擎用来爬行和抓取的程序称为蜘蛛
搜索引擎蜘蛛访问网站页面时类似于普通用户使用浏览器。蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。
1.2跟踪链接
为了抓取网上尽量多的页面,搜索引擎蜘蛛会跟踪页面上的链接,从一个页面爬行到另一个页面。
最简单的爬行遍历策略分为两种:一是深度优化 二是广度优化
1.3如何吸引蜘蛛
网站和页面权重高
页面更新
导入链接