Lindorm 时序引擎

现在系统中有一张表存了设备的各种运行状态,比如 CPU 温度、使用率、负载等,以及一些埋点事件信息,这些其实归纳起来都可以作为 metric 来进行收集,业界现在的答案基本就是 Prometheus。而 Prometheus 底层的存储就是一个时序数据库,所以很自然的,我们也想将这些数据存储到一个时序数据库中。首先是想到了 TSDB,本来阿里云也有相关的产品,但后来停止维护了,提供了 Lindorm 的时序引擎实现。所以就了解了下 Lindorm 的时序引擎,这个引擎实现了多值模型,看起来可以很好的替换 TSDB,但是后来折腾下来发现,并不适合我们的业务模型。

数据模型

数据模型

时序数据元素说明

Lindorm 时序引擎相比 OpenTSDB,在概念上还是有一些不同,比如在 OpenTSDB 中的 Metric 概念,在 Lindorm 时序引擎中就不存在了,咨询了下同学,应该就是对应 Lindorm 中表的概念,但是感觉与官网中的介绍又不大相同。其他的基本类似。

元素 描述
表名(Table) 时序表代表一系列同类时序数据的集合,例如为空气质量传感器建立一个Table,存储所有传感器的监测数据。
标签(Tag) Tag描述数据源的特征,通常不随时间变化,例如传感器设备,包含设备DeviceId、设备所在的Region等Tag信息,数据库内部会自动为Tag建立索引,支持根据Tag来进行多维检索查询。Tag由Tag Key、Tag Value组成,两者均为String类型。
在定义时序数据表时,还可以指定特定标签列作为Primary Key来显式指定数据在多个节点上分片(Data Sharding)时的分片规则,从而实现贴合业务场景的性能提升。
时间戳(Timestamp) Timestamp代表数据产生的时间点,可以写入时指定,也可由系统自动生成。
量测值(Field) Field描述数据源的量测指标,通常随着时间不断变化,例如传感器设备包含温度、湿度等Field,Field列无需提前创建固定的Schema,可以在运行过程中动态增减;Field由Field名和Field值组成,Field名为字符串类型,Field值支持多种数据类型。
数据点(Data Point) 数据源在某个时间产生的某个量测指标值(Field值)称为一个数据点,数据库查询、写入时按数据点数来作为统计指标。
时间线(Time Series) 数据源的某一个指标随时间变化,形成时间线,Tag的组合确定一条时间线。针对时序数据的计算包括降采样、聚合(sum、count、max、min等)、插值等都基于时间线维度进行;
数据库在存储数据时,会将同一条时间线的数据尽量聚类存储,提升时间线数据访问效率,同时更好的支持时序数据压缩。
在时序表中,Tag列的值都相同的一系列数据行构成了一条时间线

时间线

例如:某风力电厂包含一系列的智能风力发电机设备,创建名为 Wind-generators 的 table 来存储所有设备的信息,设备由 ID、型号、厂商等 Tag 信息描述,每个设备会持续上报功率、风速等 Field 指标,指标数据通过时序数据库的 API 实时写入到云端时序数据库。

时间线

Schema 约束

与传统关系型数据库不一样,Lindorm 时序引擎提供三种不同的 Schema 约束方式,以支持业务的快速变化。

  • 强约束
    与传统关系型数据库类似,时序引擎会严格依据预先定义的表结构对写入数据的表名、字段名、类型进行校验。不符合即出错。
  • 弱约束
    写入数据的所属表不存在时引擎不会报错,而是会自动创建对应的表。
    写入数据的新增一个标签或字段时,引擎不会校验报错,而是会在对应的时序数据表中自动添加一个TAG列或FIELD列。
    写入数据的相同字段的数据类型发生变化时时序引擎会检测到字段的数据类型不匹配而写入失败,需要使用ALTER TABLE语句手动修改字段的数据类型。
  • 无约束
    不做任何约束。代价是无法直接通过SQL查询写入的数据。

数据写入方式与Schema约束的选择

写入方式 Schema约束策略 备注
通过JDBC API写入数据 强约束 不涉及。
通过教程:通过Java Native SDK连接并使用Lindorm时序引擎写入数据 可选项。支持强约束和弱约束。 策略配置方法请参见Java Native SDK使用手册。
不配置时的默认约束是弱约束。
通过api/v2/sql使用INSERT写入数据 强约束 不涉及。
通过行协议写入数据 可选项。支持强约束和弱约束。 策略配置方法请参见行协议写入。
不配置时的默认约束是弱约束。

使用约束

数据库对象 说明
database名称 由大写字母、小写字母、数字、下划线其中的一种或多种组成,长度为2~64个字符。
database数量 一个实例最多创建16个数据库(包含default数据库)。
table名称 由大写字母、小写字母、数字、下划线其中的一种或多种组成,最大长度为128个字符。
table数量 一个数据库最多创建10000个数据表。
tag列名称 可见字符,最大长度为200个字符。
tag列值 可见字符,最大长度为20480个字符。
field列名称 可见字符,最大长度为200个字符。
field列值 可见字符,最大长度为20480个字符。
timestamp列名称 可见字符,最大长度为200个字符,一张表只能有一个timestamp列,默认作为时间索引。
timestamp列值 单位为毫秒。
列数量 一张表最多可创建1024列,其中包含tag列、timestamp列、field列。

使用说明

由上面的介绍可以看出来 Lindorm 时序引擎更像是一张普通的 MySql 表,只是会自动在 Tag 列上加索引。我们现在系统中存储的指标项已经有 200+,如果按照这种模型来建表,意味着需要建一个超过 200 列的表。虽然数据库限制上是支持的(最大 1024 列),并且 Native SDK 还支持动态列,也不需要预先 DDL。但是在使用上实在是个难题,难道也建一个 200+ 字段的对象进行映射吗?

最初想到的解决方案是在 Tag 列中加一个 metric 字段,用来存储各种指标的名称,这样跟现在的数据库存储模型基本一致。但咨询过 Lindorm 的同学,告知每单位 CPU 最大支撑同时 10w 时间线 (推荐 4w 时间线)。而我们现在有 2W 设备,如果将 metirc 作为 Tag,意味着将有超过 400W 时间线,这个成本有点高。由于绝大多数查询是通过设备 ID + metric + ts,所以 metric 也无法作为普通的 Field 列做存储,而且同一时间可能有多个 metric。

兼容TSDB

看官网上的介绍,对 TSDB 的兼容,是通过 table 与 metric 做对应的。这个实际操作起来太麻烦,首先表的数量太多,其次就是后续表数据同步都是问题。

TSDB模型

其实对监控、指标收集类型的业务来说,还是 TSDB 这样的模型比较适合。因为指标项有可能很多,而且随着业务的扩展也会不断增加。Lindorm 的时序引擎,也支持单值模型,但是看官网上的介绍,应该是支持有限也不推荐使用,所以也就没有再去尝试使用。

Lindorm 的时序引擎选择的这个多值模型,我猜想可能是跟底层使用列式存储有关系。这个多值模型适合于有少量固定列的情况,相比较 MySql 数据库提供更加高效的写入能力,提供了降采样、插值等高级能力。其他基本与 MySql 模型没有差别。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,875评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,569评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,475评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,459评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,537评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,563评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,580评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,326评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,773评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,086评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,252评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,921评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,566评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,190评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,435评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,129评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,125评论 2 352

推荐阅读更多精彩内容