Druid-Druid中Historical Process

  • 基于apache-druid-0.17

启动命令

org.apache.druid.cli.Main server historical

加载和服务Segment

  • 每个Historical进程维护一个与Zookeeper的固定连接,并监视可配置的Zookeeper路径,以获取新的Segment信息。历史一个之间不直接通信,也不与Coordinator进程通信,而是依赖于Zookeeper进行协调。
  • Coordinator进程负责将新的Segment分配给Historical进程。分配方法是通过在在Historical进程关联的负载队列路径下创建临时Zookeeper条目来完成的。
  • 当Historical进程在其负载队列路径中注意到一个新的负载队列条目时,它将首先检查本地磁盘目录(缓存),以获得关于Segment的信息。如果缓存中不存在关于该Segment的信息,则Historical进程将从Zookeeper下载关于新Segment的元数据。此元数据包括关于段位于Deep Storage中的何处以及如何解压和处理Segment的规则。一旦一个Historical进程完成了对一个Segment的处理,这个Segment就会在Zookeeper中与该进程相关联的服务段路径下被声明。此时,该Segment可用于查询。

从缓存中加载和服务Segment

  • 回想一下,当Historical进程在其负载队列路径中注意到一个新的Segment条目时,历史进程首先检查其本地磁盘上的一个可配置缓存目录,以查看该Segment之前是否已下载。如果本地缓存项已经存在,历史进程将直接从磁盘读取Segment二进制文件并加载Segment。
  • Segment缓存在第一次启动Historical进程时也会得到利用。在启动时,Historical进程将搜索其缓存目录,并立即加载和服务所有找到的Segment。该特性允许在Historical进程上线时立即查询它们。

查询 Segment

  • Historical 进程可以配置为log和report 监控指标,用于记录每个query的性能。
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 基于apache-druid-0.17.0 Configuration和HTTP endpoints详见官网; 概...
    李小李的路阅读 865评论 0 1
  • Druid.io(以下简称Druid)是面向海量数据的、用于实时查询与分析的OLAP存储系统。Druid的四大关键...
    大诗兄_zl阅读 6,572评论 0 9
  • 我们知道Druid能够同时提供对大数据集的实时摄入和高效复杂查询的性能,主要原因就是它独到的架构设计和基于Data...
    allin8116阅读 533评论 0 2
  • 我们知道Druid能够同时提供对大数据集的实时摄入和高效复杂查询的性能,主要原因就是它独到的架构设计和基于Data...
    零度沸腾_yjz阅读 21,849评论 3 17
  • #refer1:http://www.cnblogs.com/xd502djj/p/6408979.html#re...
    liuzx32阅读 2,040评论 0 1

友情链接更多精彩内容