数据库集簇、数据库和表
- 了解数据库集簇的逻辑、物理结构
- 堆表文件的内部布局
- 从表中读取数据的方式
参考文档:http://www.interdb.jp/pg/pgsql01.html
1. 数据库集簇
-
数据库集簇逻辑结构
数据库集簇是openGauss服务管理的数据库的集合,数据库是数据库对象的集合,数据库对象包括了表,索引,视图,函数,序列等等。
-
数据库集簇逻辑结构
gs_initdb初始化新的数据库集簇,PGDATA环境变量指定了数据库集簇的目录,其中base目录下的子目录是数据库的目录,配置相关信息在postgresql.conf文件中,还有一些系统表相关的目录及表空间相关的目录。
数据库对象目录及文件名关联数据库对象的OID,如数据库目录名关联数据库的OID。
postgres=# SELECT datname, oid FROM pg_database WHERE datname ='postgres';
datname | oid
----------+-------
postgres | 15098
(1 row)
postgres=# SELECT datname, oid FROM pg_database WHERE datname ='template1';
datname | oid
-----------+-----
template1 | 1
(1 row)
- 数据库布局
数据库目录下包含了表文件,索引文件,空闲空间映射文件,可见性映射文件。
表文件、索引文件名为表、索引OID,如有多个文件,会以OID.1,OID.2编号下去。文件名后缀为_fsm为空闲空间映射文件,文件名后缀为_vm为可见性映射文件。
对象具体存储的路径可由函数pg_relation_filepath查询。
postgres=# create table t1(id int);
CREATE TABLE
postgres=# select pg_relation_filepath('t1'::regclass);
pg_relation_filepath
----------------------
base/15098/40981
(1 row)
- 表空间
openGauss支持创建表空间
postgres=# create tablespace test location '/data/gsdata2';
CREATE TABLESPACE
表空间创建成功后,在数据库集簇初始化目录下的pg_tblspc会创建一个软链接,链接到表空间的真实目录。
[root@localhost /]# cd data/gsdata/pg_tblspc/
[root@localhost pg_tblspc]# ll
total 0
lrwxrwxrwx. 1 gs gs 20 Jun 17 09:08 16384 -> /data/gsdata1/gstest
lrwxrwxrwx. 1 gs gs 13 Jun 18 18:40 40984 -> /data/gsdata2
如果创建表时指定了该表空间,则表相关文件会存放在新表空间目录下。
postgres=# create table t2(id int) tablespace test;
CREATE TABLE
postgres=# SELECT pg_relation_filepath('t2');
pg_relation_filepath
-----------------------------------------------------
pg_tblspc/40984/PG_9.2_201611171_cctest/15098/40985
(1 row)
2. 堆表文件的内部布局
堆文件内部由多个页(块)组成,页默认大小为8K,当页空闲空间不足里,会初始化新的页,增加文件大小,页由0开始顺序编号。
页的内部布局包括头部信息,行指针,空闲空间,堆元组。
- 堆元组
从页的底部开始写入。 - 行指针
指向堆元组的指针,从1开始顺序编号。当新元组写入页时,同时新增指向该元组的行指针。 - 头部信息
pd_lsn:存储该页最新更改的XLOG记录的LSN。
pg_checksum:存储该页的校验和。
pg_lower:指向行指针的尾部。
pg_upper:指向堆元组的头部。
pg_lower位置到pg_upper位置中间这部分为页的空闲空间。
3. 从表中读取数据的方式
- 顺序扫描
全表扫描时,会按页编号顺序,行指针编号顺序读取所有数据。 -
B树索引扫描
索引文件中存储了索引信息,包括索引字段、值及对应堆表文件中的TID信息。如果在索引文件中扫描到对应的TID,openGauss从根据TID查询出堆表文件中的数据。
如下图中TID=(block=7,Offset=2),指的是第7个页,第2个行指针指向的元组。