升级Druid集群

为了能够在不影响线上服务,无缝的升级Druid集群,建议按照以下顺序更新Druid节点。

  1. Historical
  2. Overlord
  3. Middle Manager
  4. Standalone Real-time
  5. Broker
  6. Coordinator

Historical

历史节点一次更新一个,历史节点启动的时候将提供服务的所有Segment加载映射到内存中,这可能只需要几秒就能完成,也可能需要几分钟,取决于历史节点的硬件条件,以及数据量。两个历史节点更新的时间间隔应该大于一个历史节点的启动时间。

Overlord

Overlord节点也是一次更新一个。然后逐个更新。

Middle Managers

Middle Manager节点运行着批处理任务和时间索引任务。如果想要在不影响任务的前提下升级Middle Managers节点,可以通过以下三种策略。

Rolling restart (基于恢复)

如果 Middle Managers节点配置了druid.indexer.task.restoreTasksOnRestart=true参数。如果配置了个该参数索引任务的状态存储在磁盘, Middle Manager节点重启以后索引任务也会自动重启,而不会失败。

Rolling restart (基于优雅的终止)

Middle Manager节点可以通过"disable" API优雅的终止。这种方式适合所有的任务,包括不可恢复的任务。
在打算升级 Middle Manager节点时,首先向<MiddleManager_IP:PORT>/druid/worker/v1/disable发送post请求。这样Overlord节点不再会发送新的任务到该 Middle Manager节点。等待当前的任务运行完成。节点状态可以通过<MiddleManager_IP:PORT>/druid/worker/v1/enabled获取。通过GET请求<MiddleManager_IP:PORT>/druid/worker/v1/tasks获取当前的所有任务。当获取的列表为空时,你就可以安全的更新Middle Manager节点了。当Middle Managers节点启动以后,它会自动开启,接收任务,可以通过向<MiddleManager_IP:PORT>/druid/worker/v1/enable发送post请求来开启。

Autoscaling-based replacement(自动扩容更新)

如果Overlord节点开启了自动扩容,Overlord节点可以启动大量新的Middle Manager节点,在当老的Middle Manager节点上的任务完成以后,安全的关闭老的Middle Manager节点。这个过程可以通过druid.indexer.runner.minWorkerVersion=#{VERSION}来设置。每次更新overlord节点,VERSION的值应该递增,这样将会有大量的新的Middle Manager节点启动。druid.indexer.autoscale.workerVersion=#{VERSION}参宿也需要设置。

Standalone Real-time

Standalone Real-time节点也是一次更新一个。然后逐个更新。

Broker

Broker节点也是一次更新一个,然后逐个更新。Broker节点启动后需要加载整个集群的健康状态信息,所以两个Broker节点的更新时间间隔应该由一定的延迟。

Coordinator

Coordinator节点也是一次更新一个。然后逐个更新。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Druid具有高可用、高容错的特性。 本文将搭建一个简单的Druid集群,并且将会讨论如何进一步配置以满足您的需求...
    helloworld1214阅读 11,959评论 1 5
  • Druid被设计成可扩展、高容错的集群。 在本文档中,我们将搭建一个简单的集群,并讨论如何进一步配置以满足您的需求...
    Sisyphus秋居拾遗阅读 6,528评论 0 2
  • 什么是Druid Druid是一个高效的数据查询系统,主要解决的是对于大量的基于时序的数据进行聚合查询。数据可以实...
    Hanze2111阅读 55,876评论 5 29
  • 概述 设计原则 快速查询:部分数据的聚合 + 内存化 + 索引 水平扩展能力:分布式数据 + 并行化处理 实时分析...
    zfylin阅读 7,539评论 0 1
  • Druid 是一个为在大数据集之上做实时统计分析而设计的开源数据存储。这个系统集合了一个面向列存储的层,一个分布式...
    曹振华阅读 12,816评论 1 24