Druid-前言(OLAP简介)-博客-云栖社区-阿里云 https://yq.aliyun.com/articles/58777
Druid-基本概念-博客-云栖社区-阿里云 https://yq.aliyun.com/articles/58779?spm=5176.100239.blogcont58778.12.Rg7WZW
Data
druid的数据格式和关系型数据库数据较为类似, 如下:
timestamp publisher advertiser gender country click price
2011-01-01T01:01:35Z bieberfever.com google.com Male USA 0 0.65
2011-01-01T01:03:63Z bieberfever.com google.com Male USA 0 0.62
2011-01-01T01:04:51Z bieberfever.com google.com Male USA 1 0.45
2011-01-01T01:00:00Z ultratrimfast.com google.com Female UK 0 0.87
2011-01-01T02:00:00Z ultratrimfast.com google.com Female UK 0 0.99
2011-01-01T02:00:00Z ultratrimfast.com google.com Female UK 1 1.53
熟悉OLAP的同学,对以下这些概念一定不陌生,druid也把数据分为以下三个部分:
Timestamp Column:将时间单独处理,是因为druid所有的操作都是围绕时间轴来进行的。
Dimension Columns:维度字段,是数据的属性, 一般被用来过滤数据。上面的例子,我们有四个维度, publisher, advertiser, gender, country. 他们每一个都可以看是数据立方体的一个轴,都可以用来用来做横切。
Metric Columns: 度量字段,是用来做聚合或者相关计算的。 上边的数据, click和price是俩个度量。度量是可以衡量的数据,一般可以有如下的操作,count ,sum等等