32、初识搜索引擎_分页搜索以及deep paging性能问题深度图解揭秘

1、如何使用Elasticsearch进行分页搜索的语法

size:分页的页大小
from:分页到第几页,从0开始为第一页

语法:

GET /_search?size=10
GET /_search?size=10&from=0
GET /_search?size=10&from=20

举例:

1、首先查询test_index/test_type中有几条数据,哪些数据

GET /test_index/test_type/_search
-----------------------------结果----------------------------
{
  "took": 8,
  "timed_out": false,
  "_shards": {
    "total": 3,
    "successful": 3,
    "failed": 0
  },
  "hits": {
    "total": 9,
    "max_score": 1,
    "hits": [....省略 ]
  }
}
查询到的9条数据,id分别是:AW9QyvfMvHutHJSW2Hir,7,11,2,5,8,9,1,3

2、我们假设将这9条数据分成3页,每一页是3条数据,来实验一下这个分页搜索的效果
第一页:id = AW9QyvfMvHutHJSW2Hir,7,11

GET /test_index/test_type/_search?from=0&size=3
-------------------------结果----------------------------
{
  "took": 2,
  "timed_out": false,
  "_shards": {
    "total": 3,
    "successful": 3,
    "failed": 0
  },
  "hits": {
    "total": 9,
    "max_score": 1,
    "hits": [
      {
        "_index": "test_index",
        "_type": "test_type",
        "_id": "AW9QyvfMvHutHJSW2Hir",
        "_score": 1,
        "_source": {
          "test_content": "my test_content automatic"
        }
      },
      {
        "_index": "test_index",
        "_type": "test_type",
        "_id": "7",
        "_score": 1,
        "_source": {
          "test_field": "test client 2"
        }
      },
      {
        "_index": "test_index",
        "_type": "test_type",
        "_id": "11",
        "_score": 1,
        "_source": {
          "num": 0,
          "tags": [
            "tag1"
          ]
        }
      }
    ]
  }
}

第二页:id = 2,5,8

GET /test_index/test_type/_search?from=3&size=3

第三页:id = 9,1,3

GET /test_index/test_type/_search?from=6&size=3

2、什么是deep paging,它的底层原理是什么,会产生什么问题?

deep paging性能问题,很高级的知识点

什么是deep paging:

deep paging简单来说就是搜索过深。比如总共有4个shard,其中有3个shard存储有相同索引的数据,有一个shard上没有,总共有60000条数据,3个shard,每个shard上存储了20000条数据,每页是10条数据,这个时候,要搜索第1000页的数据,一般情况下,搜索到的就是10001-10010,但是分片从每个shard上获取数据的话,我们真正获取到的数据是第几条到第几条?

错误的理解:每个shard都要返回的是最后10条数据。
错误原因:因为客户端的请求可能首先会发送到一个不包含这个index的shard上去,这个node就是coordinate node,那么这个coordinate node就会将搜索请求转发到index的三个shard所在node上去。

实际情况:要搜索60000条数据中的第1000页的数据,实际上每个shard都要将内部的20000条数据从第1000页数据如第10001-10010条为止之前的数据都拿出来,不是只拿10条,而是拿10010条数据,3个shard每个shard都返回10010条数据给coordinate node,coordinate node会总共接收30030条数据,然后再把这些数据进行排序,这里排序根据_score(相关度分数)排序,从排序之后的数据里取第1000页的数据,正好10条数据,并返回给客户端。

deep paging有什么问题:

搜索过深的时候,就需要在coordinate node上存储大量的数据,还要进行大量数据的排序,排序之后,再取出对应的那一页,这个过程,既会耗费网络宽带和内存,还因为大量的排序运算耗费cpu,这是deep paging的性能问题,我们应该尽量避免出现这种deep paging操作。


deep paging问题图解
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,240评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,328评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,182评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,121评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,135评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,093评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,013评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,854评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,295评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,513评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,678评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,398评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,989评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,636评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,801评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,657评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,558评论 2 352