Elasticsearch原理解析--aggregate_metric_double类型介绍

aggregate_metric_double是ES引入的一种新的字段类型,功能比较简单,但是在时序场景非常好用,本篇文章简单介绍下这个特性。

aggregate_metric_double是直接写入已经按max、min、sum、avg、count聚合好的数据。这样对这个字段进行max、min、sum、avg、count聚合的时候,不再需要实时计算,直接使用聚合的结果即可。

aggregate_metric_double的使用可以参看官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/8.6/aggregate-metric-double.html

简单看下使用方式,创建一个aggregate_metric_double类型字段的索引:

{
  "mappings": {
    "properties": {
      "agg_metric": {
        "type": "aggregate_metric_double",
        "metrics": [ "min", "max", "sum", "value_count" ],
        "default_metric": "max"
      }
    }
  }
}

这里字段需要写入"min", "max", "sum", "value_count"四个结果。

然后default_metric配置为max,这里说的是如果不是进行max、min、sum、avg、count聚合,agg_metric字段默认使用max的value。

写入数据示例如下:

PUT stats-index/_doc/1
{
  "agg_metric": {
    "min": -302.50,
    "max": 702.30,
    "sum": 200.0,
    "value_count": 25
  }
}

查询时,直接对agg_metric执行进行查询即可:

POST stats-index/_search?size=0
{
  "aggs": {
    "metric_min": { "min": { "field": "agg_metric" } },
    "metric_max": { "max": { "field": "agg_metric" } },
    "metric_value_count": { "value_count": { "field": "agg_metric" } },
    "metric_sum": { "sum": { "field": "agg_metric" } },
    "metric_avg": { "avg": { "field": "agg_metric" } }
  }
}

这里可以看到,写入的时候不需要写入avg value,因为avg value会通过sum/value_count计算得到。

aggregate_metric_double功能实现也比较简单,具体实现在x-pack-aggregate-metric插件中。

主要功能是在AggregateDoubleMetricFieldMapper中实现。AggregateDoubleMetricFieldMapper会为每个metric保留一个NumberFieldMapper。AggregateDoubleMetricFieldMapper在写入时,进行字段解析,然后将对应的字段写入对应的NumberFieldMapper中。

查询时的实现方式是扩展了Aggregator的实现,分别实现了max、min、sum、avg、count的Aggregator。

然后将这些Aggregator注册,一个示例如下:

    public static void registerSumAggregator(ValuesSourceRegistry.Builder builder) {
        builder.register(
            SumAggregationBuilder.REGISTRY_KEY,
            AggregateMetricsValuesSourceType.AGGREGATE_METRIC,
            AggregateMetricBackedSumAggregator::new,
            true
        );
    }

这样在进行Sum Aggregation的时候,发现是对aggregate_metric_double的字段进行Aggregation,就会调用到AggregateMetricBackedSumAggregator进行计算,AggregateMetricBackedSumAggregator实现了从aggregate_metric_double从获取sum类型对应的value,进行sum运算,就能完成对应需求。

另外由于aggregate_metric_double支持default_metric,所以aggregate_metric_double还能支持一些基础的query功能,包括:exists、range、term、terms。实现方式就是使用default_metric对应的索引字段,比如对termQuery的支持如下:

        @Override
        public Query termQuery(Object value, SearchExecutionContext context) {
            if (value == null) {
                throw new IllegalArgumentException("Cannot search for null.");
            }
            return delegateFieldType().termQuery(value, context);
        }
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容