数据库是几张表放在一起,而这些表之间又有相互关系。而表是信息的集合,是我们需要的元信息的组合。这个信息必须只划分到我们感兴趣的层级,如果再更细致则毫无意义并且可能浪费资源。
不管是表的信息如何复杂,对表的结构划分还是要遵循主体清晰可辨。也就是表的划分主体应该是业务中的实际的自然主体。例如客户信息和银行账号信息,是自然形成的不同主体。
对于表中的数据,也尽量遵循最小可划分原则,尽量不要重复。例如身份证中其实有一位是跟性别有关,但一般可能并不明显,其实应该单独写出性别,这种并不算重复。
而客户的电话号码可能在两张表中都存在,这时建立关系即可,没必要重复输入。这其实跟编程的不重复原则也是相同的。
电子表格使用中常遇到的一点就是未格式化,尤其是顺序和填写规范。在批量处理时造成很多问题。这跟表的设计好坏也有一定关系。