1.优点
1.大多数请求是读请求
2.不修改已存在的数据
3.不支持事务
4.对数据的一致性要求低
5.单次插入>1000rows
6.每次读取相当大量数据,但是只需要少量数据行
2.数据类型
1.demical
2.String
3.Date,DateTime
4.Float32--->float
5.Float64---->double
6.array[]
3.数据表引擎
MergerTree()系列支持数据复制,分区。ReplacingMergeTree()与MergeTree()区别是它会删除排序键相同的重复项
分布式引擎Distributed()
4.集群
集群方案采用ReplacingMergeTree()本地表加上Distributed()分布式表。
在每个节点建立本地复制表,在任意一个节点创建分布表。
复制表同步原理
engine = ReplicatedMergeTree('/ck/tables/1/test/{shard}/hits', '{replica}'),配置Zookeeper,会把一个分片下的所有副本数据进行同步复制
Distributed分布式表
分布式表其实是一种视图,
分布式引擎,本身不存储数据,但可以在多个服务器上进行分布式查询。读是自动并行的。读取时,远程服务器表的索引(如果存在)会被使用。