登录注册写文章

45.集群调优策略—deep Paging 性能优化

大勇任卷舒

45.集群调优策略—deep Paging 性能优化

45.1 deep Paging 性能优化

深度分页性能问题
- ES中有个配置： index.max_result_window，默认是10000条数据，如果分页的数据超过10000，就拒绝返回结果
深度分页的解决方案
- 方案一：用scroll遍历方式
- 方案二：search after 方式

45.2 利用scroll遍历方式

scroll分为初始化和遍历两步，初始化时将所有符合搜索条件的搜索结果缓存起来，可以理解为快照
- 在遍历时，从这个快照中取数据，也就是说在初始化后，对索引插入、删除、更新数据都不会影响遍历结果
初始化
- 后面跟的两个参数： scroll 代表缓存暂存时间，其他的和普通search求相同
- 执行完命令后会返回一个_scroll_id，用来下次去数据的时候使用

post /student/_search?scroll=1m&size=2
{
  "query":{"match_all":{}}
}

遍历查询
- 这里的scroll_id是scroll初始化的唯一标识，它可能是上一次遍历取回的_scroll_id或者是初始化返回的_scroll_id，两个值应该是一样的

get /_search/scroll
{
  "scroll":"1m",
  "scroll_id":"上面初始化时返回的_scroll_id"
}

45.3 search after 方式

45.4 三种分页方式比较

大数据视频推荐：
腾讯课堂
 CSDN
AIops智能运维机器学习算法实战
 ELK入门精讲
 AIOps智能运维实战
 ELK7 stack开发运维
大数据语音推荐：
ELK7 stack开发运维
 企业级大数据技术应用
 大数据机器学习案例之推荐系统
 自然语言处理
 大数据基础
 人工智能：深度学习入门到精通

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

44.集群调优策略—Search读优化
44.1 数据分组 ES经常用来存储日志，日志的索引管理方式一般基于日期的，如基于年、月、日、周等建立索引：当...
大勇任卷舒阅读 166评论 0赞 0
43.集群调优策略—Index 写调优-2
43.1 Index 写调优批处理批处理把多个index操作请求合并到一个batch中处理但每次批处理多少个do...
大勇任卷舒阅读 205评论 0赞 0

42.集群调优策略—Index 写调优-1
42.1 分布式集群调优策略主要从index写调优和Search读两个方面进行调优 Index 写调优副本数设置...
大勇任卷舒阅读 199评论 0赞 0
31.Elasticsearch集群故障排查及修复-2
31.1 定位红色或黄色的索引进一步定位未分配的原因可以要求集群进一步返回给定分片的当前分配情况和逻辑需要结合第...
大勇任卷舒阅读 295评论 0赞 0
13.Elasticsearch集群
13.1 Elasticsearch集群简介 Elasticsearch用于构建高可用和可扩展的系统。扩展的方式可...
大勇任卷舒阅读 256评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文