- 物化视图把查询的结果根据相应的引擎存入到了磁盘或内存中,对数据重新进行了组织,可以理解物化视图是完全的一张新表。需要注意的是,物化视图的数据并不跟着数据源数据的改变触发改变。
- 个人的一些思考:物化视图也好、Projection也好,本质上是基于一个表的数据的重新排序、聚合、持久化,形成一个新的子表,不同之处这个子表有一个数据库层面上的父亲。这种在数据库层面建立的血缘关系不是特别友好,增加了概念的复杂度。
- 基本语法
也是 create 语法,会创建一个隐藏的目标表来保存视图数据。也可以 TO 表名,保存到一张显式的表。没有加 TO 表名,表名默认就是 .inner.物化视图名
CREATE [MATERIALIZED] VIEW [IF NOT EXISTS] [db.]table_name [TO[db.]name]
[ENGINE = engine] [POPULATE] AS SELECT ...
- 创建物化视图的限制
4.1 必须指定物化视图的 engine 用于数据存储
4.2 TO [db].[table]语法的时候,不得使用 POPULATE。
4.3 查询语句(select)可以包含下面的子句: DISTINCT, GROUP BY, ORDER BY, LIMIT…
4.4 物化视图的 alter 操作有些限制,操作起来不大方便。
4.5 若物化视图的定义使用了 TO [db.]name 子语句,则可以将目标表的视图 卸载DETACH 再装载 ATTACH - 物化视图的数据更新
5.1 物化视图创建好之后,若源表被写入新数据则物化视图也会同步更新
5.2 POPULATE 关键字决定了物化视图的更新策略:
- 若有 POPULATE 则在创建视图的过程会将源表已经存在的数据一并导入,类似于create table ... as
- 若无 POPULATE 则物化视图在创建之后没有数据,只会在创建只有同步之后写入源表的数据
- clickhouse 官方并不推荐使用 POPULATE,因为在创建物化视图的过程中同时写入的数据不能被插入物化视图。
- 物化视图不支持同步删除,若源表的数据不存在(删除了)则物化视图的数据仍然保留
- 物化视图是一种特殊的数据表,可以用 show tables 查看
- 物化视图数据的删除:
- 物化视图的删除:
- 案例操作
6.1 建表
# 建表语句
CREATE TABLE hits_test
(
EventDate Date,
CounterID UInt32,
UserID UInt64,
URL String,
Income UInt8
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(EventDate)
ORDER BY (CounterID, EventDate, intHash32(UserID))
SAMPLE BY intHash32(UserID)
SETTINGS index_granularity = 8192
6.2 导入一些数据
INSERT INTO hits_test
SELECT
EventDate,
CounterID,
UserID,
URL,
Income
FROM hits_v1
limit 10000;
6.3 创建物化视图
#建表语句
CREATE MATERIALIZED VIEW hits_mv
ENGINE=SummingMergeTree
PARTITION BY toYYYYMM(EventDate) ORDER BY (EventDate, intHash32(UserID))
AS SELECT
UserID,
EventDate,
count(URL) as ClickCount,
sum(Income) AS IncomeSum
FROM hits_test
WHERE EventDate >= '2014-03-20' #设置更新点,该时间点之前的数据可以另外通过
#insert into select …… 的方式进行插入
GROUP BY UserID,EventDate;
##或者可以用下列语法,表 A 可以是一张 mergetree 表
CREATE MATERIALIZED VIEW 物化视图名 TO 表 A
AS SELECT FROM 表 B;
#不建议添加 populate 关键字进行全量更新
6.4 导入增量数据
#导入增量数据
INSERT INTO hits_test
SELECT
EventDate,
CounterID,
UserID,
URL,
Income
FROM hits_v1
WHERE EventDate >= '2014-03-23'
limit 10;
#查询物化视图
SELECT * FROM hits_mv;
6.5 导入历史数据
#导入增量数据
INSERT INTO hits_mv
SELECT
UserID,
EventDate,
count(URL) as ClickCount,
sum(Income) AS IncomeSum
FROM hits_test
WHERE EventDate = '2014-03-20'
GROUP BY UserID,EventDate
#查询物化视图
SELECT * FROM hits_mv;