算法:
当ClickHouse合并数据片段时,它会删除满足如下条件的行:排序键相同,version相同,Sign不同。
如果Version列不在排序键中,则ClickHouse会将其隐式地作为最后一个字段添加到排序键中,并将其用于排序。
一、实例
DROP TABLE IF EXISTS UAct;
CREATE TABLE UAct
(
`UserID` UInt64,
`PageViews` UInt8,
`Duration` UInt8,
`Sign` Int8,
`Version` UInt8
)
ENGINE = VersionedCollapsingMergeTree(Sign, Version)
ORDER BY UserID;
INSERT INTO UAct VALUES
(4324182021466249494, 5, 146, 1, 1);
INSERT INTO UAct VALUES
(4324182021466249494, 5, 146, -1, 1),
(4324182021466249494, 6, 185, 1, 2);
SELECT * FROM UAct;
Query id: cee5138f-d5fc-451d-b983-04a750644541
┌──────────────UserID─┬─PageViews─┬─Duration─┬─Sign─┬─Version─┐
│ 4324182021466249494 │ 5 │ 146 │ 1 │ 1 │
└─────────────────────┴───────────┴──────────┴──────┴─────────┘
┌──────────────UserID─┬─PageViews─┬─Duration─┬─Sign─┬─Version─┐
│ 4324182021466249494 │ 5 │ 146 │ -1 │ 1 │
│ 4324182021466249494 │ 6 │ 185 │ 1 │ 2 │
└─────────────────────┴───────────┴──────────┴──────┴─────────┘
3 rows in set. Elapsed: 0.018 sec.
OPTIMIZE TABLE UAct
SELECT * FROM UAct;
Query id: da41ebc4-3f9f-4828-b173-450ea03fa73b
┌──────────────UserID─┬─PageViews─┬─Duration─┬─Sign─┬─Version─┐
│ 4324182021466249494 │ 6 │ 185 │ 1 │ 2 │
└─────────────────────┴───────────┴──────────┴──────┴─────────┘
1 rows in set. Elapsed: 0.009 sec.