登录注册写文章

43.集群调优策略—Index 写调优-2

大勇任卷舒

43.集群调优策略—Index 写调优-2

43.1 Index 写调优

批处理
- 批处理把多个index操作请求合并到一个batch中处理
- 但每次批处理多少个doc文件效率更高，受很多因素影响，如doc的大小，字段类型、分词器等
document的路由处理
- 当对一批中的docs进行index操作时，该批index操作所需的线程的个数由要写入的shard的个数决定。如下图：
document的路由处理
- 图中，有2批docs写入ES，每次需要写入4个shard，所以共需要8个线程，如果能减少shard数，那么消耗的线程数也会减少。如果两批中每批的shard个数都只有2个，总共线程消耗个数4个，减少一半，如下图：
默认的routing就是id，也可以在发送求时，手动指定一个routing value，如：

put /index/doc/id?routing=user_id

注意：线程数降低，但单批的处理耗时可能增加，和提高刷新时间间隔类似，有可能会牺牲数据的实时性
存储
- 使用 SSD
- 使用 RAID 0
- 使用多块硬盘，并允许 Elasticsearch 通过多个 path.data 目录配置把数据条带化分配到它们上面
- 不要使用远程挂载的存储，比如 NFS 或者 SMB/CIFS

大数据视频推荐：
腾讯课堂
 CSDN
AIops智能运维机器学习算法实战
 ELK入门精讲
 AIOps智能运维实战
 ELK7 stack开发运维
大数据语音推荐：
ELK7 stack开发运维
 企业级大数据技术应用
 大数据机器学习案例之推荐系统
 自然语言处理
 大数据基础
 人工智能：深度学习入门到精通

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

42.集群调优策略—Index 写调优-1
42.1 分布式集群调优策略主要从index写调优和Search读两个方面进行调优 Index 写调优副本数设置...
大勇任卷舒阅读 149评论 0赞 0
36.ES集群规划—容量规划-2
36.1 容量规划案例1 固定大小的数据集一些案例：唱片信息库 / 产品信息一些特性被搜索的数据集很大，但是增长相...
大勇任卷舒阅读 481评论 0赞 0
13.Elasticsearch集群
13.1 Elasticsearch集群简介 Elasticsearch用于构建高可用和可扩展的系统。扩展的方式可...
大勇任卷舒阅读 184评论 0赞 0
31.Elasticsearch集群故障排查及修复-2
31.1 定位红色或黄色的索引进一步定位未分配的原因可以要求集群进一步返回给定分片的当前分配情况和逻辑需要结合第...
大勇任卷舒阅读 257评论 0赞 0
40.冷热集群搭建及使用实践
40.1 集群规格选型根据业务数据量及读写性能要求选择合适的冷热节点规格副本数量：副本有利于增加数据的可靠性，但...
大勇任卷舒阅读 170评论 0赞 0

赞1赞

赞赏

手机看全文