ClickHouse - 05

7、DDL

在 ClickHouse 中，DDL语言中修改表结构仅支持Merge表引擎、Distributed表引擎及MergeTree家族的表引擎,SQL 中的库、表、字段严格区分大小写。

7.1、数据库操作

建库：在创建数据库时，在 /var/lib/clickhouse/metadata/ 目录下会有对应的库目录和 *.sql 文件，库目录中会存入在当前库下建表的信息，*.sql 文件中存放建库信息。当删除数据库时，`/var/lib/clickhouse/metadata/目录下对应的库目录和xx.sql文件也会被清空。
```
:) CREATE DATABASE [IF NOT EXISTS] db_name [ON CLUSTER cluster] [ENGINE = engine(...)];
```
查看数据库列表
```
:) SHOW DATABASES;
```

查看当前数据库

:) SELECT database();
:) SELECT currentDatabase();

切换数据库
```
:) USE db_name;
```

删除数据库

:) DROP DATABASE [IF EXISTS] db_name [ON CLUSTER cluster];

7.2、表操作

创建表

-- 直接创建表
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) ENGINE = engine;

-- 创建与other_db.other_table_name相同结构的表
-- 如果不指定ENGINE 默认与other_db.other_table_name表引擎一致
-- 不会将表other_db.other_table_name中数据填充到新表
CREATE TABLE [IF NOT EXISTS] [db.]table_name AS [other_db.]other_table_name [ENGINE = engine];

-- 指定引擎创建与SELECT子句结果相同结构的表 并将SELECT子句的结果填充至新表
CREATE TABLE [IF NOT EXISTS] [db.]table_name ENGINE = engine AS SELECT ...;

查看表列表

:) SHOW TABLES;
:) SHOW TABLES IN default;

查看表定义
```
:) SHOW CREATE TABLE table_name;
```
查看表字段
```
:) DESC table_name;
```

删除表

:) DROP [TEMPORARY] TABLE [IF EXISTS] [db.]table_name [ON CLUSTER cluster];

修改表 - 添加列

:) ALTER TABLE [db].table_name [ON CLUSTER cluster] ADD COLUMN column_name UInt8;

修改表 - 删除列

:) ALTER TABLE [db].table_name [ON CLUSTER cluster] DROP COLUMN column_name;

修改表 - 清空列：不能清空排序、主键、分区字段。

-- 清空所有分区列
:) ALTER TABLE [db].table_name [ON CLUSTER cluster] CLEAR COLUMN column_name;

-- 清空指定分区列
:) ALTER TABLE [db].table_name [ON CLUSTER cluster] CLEAR COLUMN column_name IN PARTITION 'partition';

修改表 - 修改列注释

:) ALTER TABLE [db].table_name [ON CLUSTER cluster] COMMENT COLUMN column_name 'comments';

修改表 - 修改列类型

:) ALTER TABLE [db].table_name [ON CLUSTER cluster] MODIFY COLUMN column_name UInt8;

表重命名：可以作用于任意表引擎。

-- 如果表数据库命名发生变动 将物理移动表到新数据库
:) RENAME TABLE [db_1.]table_name_1 TO [db_2.]table_name_2, [db_3.]table_name_3 TO [db_4.]table_name_4, ... [ON CLUSTER cluster];

7.3、分区表操作

ClickHouse 中只有 MergeTree Family 引擎下的表才能分区，因此分区表就是 MergeTree Family 表引擎对应的分区表。

查看分区信息
```
:) SELECT database, table, name, partition FROM system.parts WHERE TABLE = 'table_name';
```
也可以在 ClickHouse 节点上查看分区信息，路径为：/var/lib/clickhouse/data/{database}/{table_name}/。
卸载分区：将指定分区的数据移动到 detached 目录。服务器会忽略被分离的数据分区。只有当使用 ATTACH 时，服务器才会知晓这部分数据。当执行操作以后，可以对 detached 目录的数据进行任意操作，例如删除文件，或者放着不管。
```
:) ALTER TABLE table_name DETACH PARTITION partition_expr;
```
装载分区：可以将已经卸载的分区重新装载到对应的表分区中，将 detached 目录中的数据重新移动到对应的表数据目录下。也可以将卸载的分区数据加载到其他表中，但是这个表需要与原来的表具有相同的表结构及相同的分区字段。
```
:) ALTER TABLE table_name ATTACH PARTITION partition_expr;
```
删除分区：可以针对分区表删除某个分区，之后再导入当前分区的数据，以达到数据更新的目的。执行删除分区命令是直接将对应分区数据删除，不会放入 detached 目录。该操作会将分区标记为不活跃的，之后在大约10分钟内删除全部数据。
```
:) ALTER TABLE table_name DROP PARTITION partition_expr;
```
替换分区：替换分区支持将 A 表的分区数据复制到 B 表，并替换 B 表的已有分区。A 表中分区数据不会被删除，A 和 B 表必须要有相同的表结构且分区字段相同。此操作经常用作数据备份、表数据同步操作。
```
:) ALTER TABLE table_name_2 REPLACE PARTITION partition_expr FROM table_name_1;
```
移动分区：该操作将 A 表的数据分区移动到 B 表，并删除 A 表的数据。
```
:) ALTER TABLE table_source MOVE PARTITION partition_expr TO TABLE table_dest;
```
重置分区列：重置指定分区的特定列的值，就是将指定分区下某列的数据清空，如果建表时使用了 DEFAULT 语句，该操作会将列的值重置为该默认值。
```
:) ALTER TABLE table_name CLEAR COLUMN column_name IN PARTITION partition_expr;
```

7.4、临时表

ClickHouse支持临时表，临时表具备以下特征：

当会话结束或者链接中断时，临时表将随会话一起消失。
临时表仅能够使用Memory表引擎，创建临时表时不需要指定表引擎。
无法为临时表指定数据库。它是在数据库之外创建的，与会话绑定。
如果临时表与另一个表名称相同，那么当在查询时没有显式的指定 database 的情况下，将优先使用临时表。

对于分布式处理，查询中使用的临时表将被传递到远程服务器。

CREATE TEMPORARY TABLE [IF NOT EXISTS] table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
)

在大多数情况下，临时表不是手动创建的，而是在使用外部数据进行查询或分布式时创建的，可以使用 ENGINE = Memory 表代替临时表。

7.5、视图

视图不存储数据，只是一层查询映射，类似于表的别名或者同义词，能简化查询，对原有表的查询性能没有增强的作用，具体性能依赖视图定义的语句，当从视图中查询时，视图只是替换了映射的查询语句。视图当基表删除后不可用。

创建视图

:) CREATE [OR REPLACE] VIEW [IF NOT EXISTS] [db.]view_name [ON CLUSTER] AS SELECT ...;

删除视图

:) DROP VIEW view_name;
:) DROP TABLE view_name;

7.6、物化视图

物化视图是查询结果集的一份持久化存储，所以它与普通视图完全不同，而非常趋近于表。“查询结果集”的范围很宽泛，可以是基础表中部分数据的一份简单拷贝，也可以是多表 join 之后产生的结果或其子集，或者原始数据的聚合指标等。

物化视图创建之后，若源表被写入新数据则物化视图也会同步更新，POPULATE 关键字决定了物化视图的更新策略。若有 POPULATE 则在创建视图的过程会将源表已经存在的数据一并导入，类似于 CREATE TABLE ... AS。若无 POPULATE 则物化视图在创建之后没有数据，只会同步创建之后写入源表的数据。ClickHouse 官方并不推荐使用 populated，因为在创建物化视图的过程中同时写入的数据不能被插入物化视图。

物化视图是种特殊的数据表，创建时需要指定引擎，可以用 SHOW TABLES 查看。另外，物化视图不支持 ALTER 操作。

产生物化视图的过程叫做物化（Materialization），广义地讲，物化视图是数据库中的预计算逻辑+显式缓存，典型的空间换时间思路，如果使用得当，可以避免对基础表的频繁查询并复用结果，从而显著提升查询的性能。

创建物化视图

:) CREATE MATERIALIZED VIEW [IF NOT EXISTS] [db.]view_name [ON CLUSTER] [TO[db.]name] [ENGINE = engine] ORDER BY column [POPULATE] AS SELECT ...;

删除物化视图
```
:) DROP TABLE view_name;
```

当创建好物化视图后，可以进入 /var/lib/clickhouse/data/{database}/ 目录下看到对应目录，当物化视图中同步基表数据时，目录中有对应的列文件和元数据记录文件，与普通创建表一样，有目录结构。

源表的删除或修改操作，不会触发物化视图数据的修改。

8、DML

ClickHouse 中 DML 语言包含插入、更新、删除数据操作，DML 操作仅适用 MergeTree 引擎，不能针对主键、分区键、排序键进行 DML 操作。DML操作不支持事务，一旦执行成功会立刻生效。

8.1、Insert 插入

:) INSERT INTO [db.]table_name [(c1, c2, c3)] VALUES (v11, v12, v13), (v21, v22, v23), ...;

-- 使用 SELECT INSERT 需要保证结果集于目标表结构一致
:) INSERT INTO [db.]table_name SELECT ...;

8.2、Update 更新

由于 ClickHouse 针对的是 OLAP 业务分析，Update 操作在 ClickHouse 中不会经常使用。这种更新效率低下。

:) ALTER TABLE [db.]table_name UPDATE column1 = expr1 [, ...] WHERE filter_expr;

8.3、Delete 删除

由于 ClickHouse 针对的是 OLAP 业务分析，Delete 操作与 Update 操作一样在 ClickHouse 中不会经常使用。这种删除效率低下。

:) ALTER TABLE [db.]table_name [ON CLUSTER cluster] DELETE WHERE filter_expr;

8.4、导入导出

ClickHouse 中支持多种数据格式数据导入和导出，支持格式有 ORC、Parquet、Avro、Protobuf、Xml、Json、CSV 等。

具体操作参照官网：https://clickhouse.tech/docs/en/sql-reference/statements/alter/update/。

导入 CSV

_> clickhouse-client --format_csv_delimiter="," --query="INSERT INTO db.table_name FORMAT CSV" < /path/to/file.csv

导出 CSV

_> clickhouse-client --format_csv_delimiter="|" --query="SELECT * FROM db.table_name FORMAT CSV" > /path/to/file.csv

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,539评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,594评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,871评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,963评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,984评论 6赞 393
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,763评论 1赞 307
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,468评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,357评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,850评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,002评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,144评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,823评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,483评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,026评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,150评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,415评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,092评论 2赞 355