表结构数据是结构化数据的一种,是指数据结构规范、完整的数据。表结构数据的主要来源是数据库中的数据表。
每个数据表都有一个表名,数据表的表名是为了区分不同数据表。
每个数据表由多列不同的字段和多行不同的记录构成。记录指的是表结构数据中行上的信息,数据库会按照预先设计的业务逻辑单元将业务流程中每一个节点上的信息内容以不同“行”的形式不断追加记录在数据表中,所以数据表中行被成为记录。
而字段指数据表中列的信息,字段的第1行叫作“字段名”,字段名是字段的名称,用来区分不同字段,具有唯一性。从字段的第二行开始是记录,表中的1个字段只能有1种数据类型。
记录中的信息大概分为两类,一类是用来描述交易行为不同角度的信息,称为“维度”,如“付费时间”属于时间维度、“用户ID”属于“用户维度”等;另一类是描述交易结果的信息,称为“度量”,如“订单金额”“运费”“用券抵扣金额”等。
有一些表只包含维度信息而不包含度量信息,这样的表称为“维度表”,如“产品表”“用户信息表”“学生信息表”等。维度表主要用来拓展观测业务问题的角度及细节。
还有的表既包含维度信息又包含度量信息,这样的表称为事实表。如“订单表“里面既有用户ID也有订单金额。事实表用来记录业务的实际情况,在业务描述性分析中常用。业务描述性分析方法的本质就是在不同业务(维度)下对业务行为的结果(度量)进行分析、展现、论证及总结的过程。
表结构中的维度字段一般是文本型字段,而度量字段一般是数值型字段。
表结构数据的3个特征:
(1)表结构数据中的基本引用、操作、计算单位是字段或记录行。在表结构中,一次引用、操作及计算过程都至少要对一整行或一整列数据产生影响。
(2)表中所有字段的记录行数相同,数据表的数据也需要是连续的×完整方形结构分布的。
(3)几乎所有数据表中都存在且只存在一个主键。用来区分每行记录使用的字段或字段组合就是主键。主键必须同时满足“非空”“不重复”两个条件的单个字段或多个字段的组合。