ClickHouse笔记

ClickHouse安装

参考:官方安装文档
我这里选用手动下载rpm安装包

  • 环境准备
#列出所有的参数
[root@192 clickhouse]# ulimit -a
open files                      (-n) 65536
max user processes              (-u) 131072

其中有两个重要的配置open files(打开文件数限制)和max user processes(用户最大进程数限制)
因为clickhouse容易消耗cpu和磁盘,如果数据量大了,查询的线程多了.限制数低了发挥不出clickhouse的最大性能

[root@192 clickhouse]# vim /etc/security/limits.conf
[root@192 clickhouse]# vim /etc/security/limits.d/20-nproc.conf
* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

第一列表示生效的用户和用户组,*表示所有。针对user用户和group组:user@group
第二列soft表示软限制(当前值)、hard表示硬限制(最大值)
第三列nofile表示打开文件数、nproc表示打开进程数
重新链接会话即可生效

#安装相关依赖
[root@192 ~]# yum install -y libtool
[root@192 ~]# yum install -y *unixODBC*

下载好安装包后上传
1.clickhouse-client-xxx.rpm
2.clickhouse-common-static-xxx.rpm
3.clickhouse-common-static-dbg-xxx.rpm
4.clickhouse-server-xxx.rpm

  • 安装步骤
#安装上传的rpm包
[root@192 ~]# rpm -ivh clickhouse-xxx.rpm
#查看安装结果
[root@192 ~]# rpm -qa | grep clickhouse
clickhouse-server-xxx.noarch
clickhouse-client-xxx.noarch
clickhouse-common-static-dbg-xxx.x86_64
clickhouse-common-static-xxx.x86_64
修改服务端配置(集群/日志/绑定host等配置)
[root@192 ~]# vim /etc/clickhouse-server/config.xml
#默认本机127.0.0.1访问,开放所有host访问
<listen_host>::</listen_host>
#data数据存放路径
<path>/var/lib/clickhouse/</path>
#日志存放路径
<log>/var/log/clickhouse-server/clickhouse-server.log</log>
#错误日志存放路径
<errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog>
修改参数配置(CPU/内存等配置)
[root@192 ~]# vim /etc/clickhouse-server/users.xml
<background_pool_size>16</background_pool_size>
<max_concurrent_queries>200</max_concurrent_queries>
<max_threads>8</max_threads>
<max_memory_usage>10000000000</max_memory_usage>

列举几个核心调优配置

配置 推荐值 描述
background_pool_size cpu个数*2 MergeTree 引擎的表设置执行后台合并和突变的线程数
max_concurrent_queries 200 同时处理的最大请求数
max_threads cpu个数 单个查询使用的最大cpu个数
max_memory_usage 物理内存70% 限制可用内存量。该限制适用于单个服务器中的单个查询。您可以使用SHOW PROCESSLIST查看每个查询的当前内存消耗
max_bytes_before_external_group_by max_memory_usage的50% 单个GROUP BY查询操作可以使用的最大 RAM 容量
max_bytes_before_external_sort max_memory_usage的50% 单个order BY查询操作可以使用的最大 RAM 容量
启动server
[root@192 ~]# clickhouse start
客户端连接
#支持多行以;结尾执行
[root@192 ~]# clickhouse-client -m

ClickHouse使用

Clickhouse 中最强大的表引擎当属 MergeTree (合并树)引擎及该系列(*MergeTree)中的其他引擎。
MergeTree 系列的引擎被设计用于插入极大量的数据到一张表当中。数据可以以数据片段的形式一个接着一个的快速写入,数据片段在后台按照一定的规则进行合并。相比在插入时不断修改(重写)已存储的数据,这种策略会高效很多。
create table test(
    id UInt32,
    name String,
    create_time Datetime
) engine=MergeTree
    primary key (id)
    order by (id);
insert into  test values
(1,'test1','2022-04-10 00:00:00'),
(2,'test2','2022-04-11 00:00:00');

primary key\color{red}{只提供一级索引,没有唯一约束,id是可以重复插入的}
主键索引使用稀疏索引,默认间隔8192,除非该列存在大量重复的值,大于8192间隔,可以适当调大

SETTINGS index_granularity = 8192

如果不指定分区,就会存放在all分区里,也可以指定分区,这里我使用按天分区

partition by toYYYYMMDD(create_time)

merge_with_ttl_timeout — TTL合并频率的最小间隔时间,单位:秒。默认值: 86400 (1 天)。
也可以手动触发合并

#合并临时分区
optimize table test final;
#指定分区合并
 OPTIMIZE TABLE test PARTITION 20220410 FINAL;
  • 注意点
    1.避免使用Nullable字段类型,使用 Nullable 几乎总是对性能产生负面影响,在设计数据库时请记住这一点。因为存储Nullable列需要创建一个额外的文件存储null标记,而且Nullable列无法被索引
  • SQL操作
#删除
alter table test delete where id= 1;
#修改
alter table test update name='update_test' where id= 2;

删除,修改并不会操作本身的分区数据,而是新增分区,并在下一次分区合并的时候才会真正删除旧分区数据,当分区数据很多的时候,新增分区意味着耗时更长,所以要尽可能避免频繁修改删除,尽量使用批量操作。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容