2020-02-12

搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。

简单来说

第一步:读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。

第二步:使用数据库进行查找

第三步:搜索引擎从索引数据库中找到匹配该关键词的网页;

第四步:把收集来的网页进行排序,把这些进行最终的排序。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 现状: Sphinx 目前的稳定版本为 2.2.11.Sphinx 目前对英文等字母语言采用空格分词,故其对中文分...
    比尔白吃阅读 292评论 0 0
  • 2020-02-12西南风 3级 晴 今天是在家网上授课的第一天,老师在百里半平台上传了三个新阶段学习的教学视频,...
    晚屿阅读 157评论 0 0
  • 第一张1.Web信息检索的特点是什么?答:1.规模大。人类生产40亿网页[Google,2004],而书才1亿本;...
    MW演员阅读 648评论 0 0
  • 第一张 Web信息检索的特点是什么?答: 规模大。人类生产40亿网页[Google,2004],而书才1亿本;中国...
    她即我命阅读 1,032评论 0 0
  • 第一章 1.Web信息检索的特点是什么? 答:(1)规模大。人类生产40亿网页[Google,2004],而书才1...
    叕燚阅读 380评论 0 0