第六章 物化视图

  1. 物化视图把查询的结果根据相应的引擎存入到了磁盘或内存中,对数据重新进行了组织,可以理解物化视图是完全的一张新表。需要注意的是,物化视图的数据并不跟着数据源数据的改变触发改变。
  2. 个人的一些思考:物化视图也好、Projection也好,本质上是基于一个表的数据的重新排序、聚合、持久化,形成一个新的子表,不同之处这个子表有一个数据库层面上的父亲。这种在数据库层面建立的血缘关系不是特别友好,增加了概念的复杂度。
  3. 基本语法
    也是 create 语法,会创建一个隐藏的目标表来保存视图数据。也可以 TO 表名,保存到一张显式的表。没有加 TO 表名,表名默认就是 .inner.物化视图名
CREATE [MATERIALIZED] VIEW [IF NOT EXISTS] [db.]table_name [TO[db.]name] 
[ENGINE = engine] [POPULATE] AS SELECT ...
  1. 创建物化视图的限制
    4.1 必须指定物化视图的 engine 用于数据存储
    4.2 TO [db].[table]语法的时候,不得使用 POPULATE。
    4.3 查询语句(select)可以包含下面的子句: DISTINCT, GROUP BY, ORDER BY, LIMIT…
    4.4 物化视图的 alter 操作有些限制,操作起来不大方便。
    4.5 若物化视图的定义使用了 TO [db.]name 子语句,则可以将目标表的视图 卸载DETACH 再装载 ATTACH
  2. 物化视图的数据更新
    5.1 物化视图创建好之后,若源表被写入新数据则物化视图也会同步更新
    5.2 POPULATE 关键字决定了物化视图的更新策略:
  • 若有 POPULATE 则在创建视图的过程会将源表已经存在的数据一并导入,类似于create table ... as
  • 若无 POPULATE 则物化视图在创建之后没有数据,只会在创建只有同步之后写入源表的数据
  • clickhouse 官方并不推荐使用 POPULATE,因为在创建物化视图的过程中同时写入的数据不能被插入物化视图。
  • 物化视图不支持同步删除,若源表的数据不存在(删除了)则物化视图的数据仍然保留
  • 物化视图是一种特殊的数据表,可以用 show tables 查看
  • 物化视图数据的删除:
  • 物化视图的删除:
  1. 案例操作
    6.1 建表
# 建表语句
CREATE TABLE hits_test
(
  EventDate Date, 
  CounterID UInt32, 
  UserID UInt64, 
  URL String, 
  Income UInt8
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(EventDate)
ORDER BY (CounterID, EventDate, intHash32(UserID))
SAMPLE BY intHash32(UserID)
SETTINGS index_granularity = 8192

6.2 导入一些数据

INSERT INTO hits_test 
 SELECT 
 EventDate,
 CounterID,
 UserID,
 URL,
 Income 
FROM hits_v1 
limit 10000;

6.3 创建物化视图

#建表语句
CREATE MATERIALIZED VIEW hits_mv 
ENGINE=SummingMergeTree
PARTITION BY toYYYYMM(EventDate) ORDER BY (EventDate, intHash32(UserID)) 
AS SELECT
UserID,
EventDate,
count(URL) as ClickCount,
sum(Income) AS IncomeSum
FROM hits_test
WHERE EventDate >= '2014-03-20' #设置更新点,该时间点之前的数据可以另外通过
 #insert into select …… 的方式进行插入
GROUP BY UserID,EventDate;
##或者可以用下列语法,表 A 可以是一张 mergetree 表
CREATE MATERIALIZED VIEW 物化视图名 TO 表 A
AS SELECT FROM 表 B;
#不建议添加 populate 关键字进行全量更新

6.4 导入增量数据

#导入增量数据
INSERT INTO hits_test 
SELECT 
 EventDate,
 CounterID,
 UserID,
 URL,
 Income 
FROM hits_v1 
WHERE EventDate >= '2014-03-23' 
limit 10;
#查询物化视图
SELECT * FROM hits_mv;

6.5 导入历史数据

#导入增量数据
INSERT INTO hits_mv
SELECT
 UserID,
 EventDate,
 count(URL) as ClickCount,
 sum(Income) AS IncomeSum
FROM hits_test
WHERE EventDate = '2014-03-20'
GROUP BY UserID,EventDate
#查询物化视图
SELECT * FROM hits_mv;
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容