Elasticsearch原理学习(七)elasticsearch性能优化

一、硬件

es的基础是lucene,其所有的索引和文档都是存储在硬盘上的。磁盘是现代服务器上的通用瓶颈,当你的磁盘吞吐量越大,节点就越稳定,性能则越高。有几下几个可优化的方向:

1)SSD

2)RAID 0
参考:https://baike.baidu.com/item/RAID%200/10405625?fr=aladdin
RAID 0又称为Stripe或Striping,它代表了所有RAID级别中最高的存储性能。RAID 0提高存储性能的原理是把连续的数据分散到多个磁盘上存取,这样,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求。这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能。

但RAID 0在提高性能的同时,并没有提供数据保护功能,只要任何一块硬盘损坏就会丢失所有数据。因此RAID 0 不可应用于需要数据高可用性的关键领域。

3)设置多个存储路径,分布到不同的磁盘
es支持设置多个存储路径,用逗号分隔

4)不要使用远程挂载的存储,比如 NFS 或者 SMB/CIFS。

二、分片策略设置

2.1、分片数设置

分片策略提供了支持分布式和故障转移特性,但是分片也不是可以随便设置的。另外,索引的路由机制导致,分片一旦设置完成之后就不能被改变。

分片的优化必须要了解一下的概念:
1)一个分片就是一个lucene索引,会消耗一定的文件句柄,内存,CPU等。
2)每一次搜索请求需要遍历所有的分片,当分片都处于不同主机上还好,如果存在大量的分片位于同一主机,则会导致当前节点资源竞争的激烈。
3)相关度,lucene提供了相关度的搜索,分片过多导致搜索时每个分片命中低,导致整体的相关度低。
4)控制每个分片占用的硬盘容量不超过JVM配置的堆内存(通常32g),如果索引总容量在500g,分片大概16个。
5)在4)的分片设置要结合本条,一般一个节点会占用一台服务器,如果分片数大大超过了节点数量,当有节点挂机后,即使有副本的存在,仍然存在丢失数据的风险。通常分片数不会超过节点的3倍。
6)主分片,副本和节点的设置,参考以下公式:节点数<=主分片数(副本+1 )*

2.2 推迟分片分配

对于节点瞬时中断的问题,默认情况,集群会等待一分钟来查看节点是否会重新加入,如果这个节点在此期间重新加入,重新加入的节点会保持其现有的分片数据,不会触发新的分片分配。这样就可以减少 ES 在自动再平衡可用分片时所带来的极大开销。

通过修改参数 delayed_timeout ,可以延长再均衡的时间,可以全局设置也可以在索引级别进行修改:

PUT /_all/_settings
{
  "settings": {
    "index.unassigned.node_left.delayed_timeout": "5m"
  }
}

路由选择

查询时,es通过以下公式来确定文档存在哪个分片当中:

shard = hash(routing) % number_of_primary_shards

routing 默认值是文档的 id,也可以采用自定义值。

下面说下routing的作用:
不使用routing:
查询时,不知道数据具体在哪个分片上,需要经过以下两个步骤:
1)分发:请求到达协调节点后,协调节点将查询请求分发到每个分片上。
2)聚合: 协调节点搜集到每个分片上查询结果,在将查询的结果进行排序,之后给用户返回结果
使用routing:
查询的时候,可以直接根据 routing 信息定位到某个分配查询,不需要查询所有的分配,经过协调节点排序。
如果 routing 设置为 userid 的话,就可以直接查询出数据来,效率提升很多。

指定routing:

PUT /my_index2/student/1?routing=key1
{
    "name":"n1",
    "age":10
}

根据routing查询:

GET /_search_shards?routing=key1

三、写入速度优化

ES 的默认配置,是综合了数据可靠性、写入速度、搜索实时性等因素。实际使用时,我们需要根据公司要求,进行偏向性的优化。

对于搜索要求不高,二写入要求较高的场景,可以进行以下优化:
1)增加translog 的flush时间,降低每秒的读写次数(Iops),以及写阻塞(writeblock)。
2)增加索引的refresh时间,减少Segment 合并的次数。
3)调整Bulk线程池和队列。这点官方给出的建议是不进行修改。https://www.elastic.co/guide/cn/elasticsearch/guide/current/dont-touch-these-settings.html
4)使用Bulk 来进行批量写入。Bulk 默认设置批量提交的数据量不能超过 100M。
5)如前面说的提升存储设备如SSD等
6)采用默认的lucene段合并策略,后台定期执行。
7)定义尽量少的副本数量,减少io。

四、内存设置

ES 默认安装后设置的内存是 1GB,对于任何一个现实业务来说,这个设置都太小了。
通常有一下了两个原则:
1)不要超过物理内存的 50%。
Lucene 的段是分别存储到单个文件中的,这些文件都是不会变化的,所以很利于缓存,同时操作系统也会把这些段文件缓存起来,以便更快的访问。
如果我们设置的堆内存过大,Lucene 可用的内存将会减少,就会严重影响降低 Lucene 的全文本查询性能。
2)堆内存的大小最好不要超过 32GB。

最终我们都会采用 31 G 设置
-Xms 31g
-Xmx 31g

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352

推荐阅读更多精彩内容

  • 夜莺2517阅读 127,718评论 1 9
  • 版本:ios 1.2.1 亮点: 1.app角标可以实时更新天气温度或选择空气质量,建议处女座就不要选了,不然老想...
    我就是沉沉阅读 6,887评论 1 6
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,535评论 28 53
  • 兔子虽然是枚小硕 但学校的硕士四人寝不够 就被分到了博士楼里 两人一间 在学校的最西边 靠山 兔子的室友身体不好 ...
    待业的兔子阅读 2,601评论 2 9