1 数据库范式
1.1 为什么要范式
为什么需要数据库范式呢,因为必须保证数据库设计的合理性
- 数据库设计关系整个系统的架构,关系到后续的开发效率和运行效率
- 数据库的设计主要包含了设计表结构和表之间的联系
1.2 如何是合理数据库
如何是合理数据库
- 结构合理
- 冗余较小
- 尽量避免插入删除修改异常
1.3 如何才能保证数据库设计水平
如何才能保证数据库设计水平
- 遵循一定的规则
- 在关系型数据库中这种规则就称为范式
1.4 什么是范式(NF= NormalForm)
什么是范式(NF= NormalForm
)
- 范式是符合某一种设计要求的总结
- 要想设计一个结构合理的关系型数据库,必须满足一定的范式
1.5 范式的分类
第一范式
第二范式
第三范式
Boyce Codd
范式=NCNF,由Boyce
和Codd
提出的,比3NF
又进了一步,通常认为是修正的第三范式.
第四范式
第五范式
各个范式是依次嵌套包含的,范式越高,设计质量越高,在现实设计中也越难实现
一般数据库设计,只要达到第三范式,即可避免异常的出现
2 各个范式详解
2.1 第一范式
2.1.1 第一范式定义
要求:最基本的范式
数据库表每一列都是不可分割的基本数据项,同一列中不能有多个值
简单说就是要确保每列保持原子性
第一范式的合理遵循需要根据系统的实际需求来定
2.1.2 第一范式示例
示例:用户表(用户名,家庭地址)就不合理
用户表(用户名,省,城市,详细地址)很合理
系(系名称,系主任,系高级职称人数)不合理
系(系名称,系主任,系教授人数,系副教授人数)合理
2.2 第二范式
2.2.1 第二范式定义
要求:第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键
而言)
即在一个数据库表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中
2.2.2 第二范式示例
示例:
学号和课程编号作为联合主键
课程名称只依赖于课程编号,而和学号没有关系
分析以上的设计发现数据冗余
如何解决呢?
- 提取出学生表
- 提取成课程表
- 提取选课表,存放选课记录
1,学生表
2,课程表
3,选课表
2.3 第三范式
2.3.1 第三范式定义
要求:
- 确保数据表中的每一列数据都和主键直接相关,而不能间接相关
- 属性不依赖于其他非主属性
示例1:学生班级表
分析以上的表,发现有问题存在 班级名称和班级信息出现了数据冗余
如何解决?
1,学生表
2,班级表
2.4 范式优缺点
范式优点:
- 结构合理
- 冗余较小
- 尽量避免插入删除修改异常
缺点:
- 性能降低
- 多表查询比单表查询速度慢
数据库的设计应该根据当前情况和需求做出灵活的处理。
在实际设计中,要整体遵循范式理论。
如果在某些特定的情况下还死死遵循范式也是不可取的,因为可能降低数据库的效率,此时可以适当增加冗余而提高性能。
示例:
比如经常购物车条目的中除了条目编号,商品编号,商品数量外,可以增加经常使用的商品名称,商品价格等
商品表
订单明细表
2.5 数据库表之间关系
数据库表之间的三种关系:
-
一对一
关联映射:一对一
一对一关系就如球队与球队所在地址之间的关系,一支球队仅有一个地址,而一个地址区也仅有一支球队。
数据表间一对一关系的表现有两种,一种是外键关联,一种是主键关联。图示如下:
一对一外键关联:
-
一对多
关联映射:一对多/多对一
存在最普遍的映射关系,简单来讲就如球员与球队的关系;
一对多:从球队角度来说一个球队拥有多个球员 即为一对多
多对一:从球员角度来说多个球员属于一个球队 即为多对一
数据表间一对多关系如下图:
-
多对多
关联映射:多对多
多对多关系也很常见,例如学生与选修课之间的关系,一个学生可以选择多门选修课,而每个选修课又可以被多名学生选择。
数据库中的多对多关联关系一般需采用中间表的方式处理,将多对多转化为两个一对多。
数据表间多对多关系如下图:
2.6 三大范式总结
范式是指导数据设计的规范化理论,可以保证数据库设计质量
第一范式:字段不能再分
第二范式:不存在局部依赖
第三范式:不含传递依赖(间接依赖)
使用范式可以减少冗余,但是会降低性能
特定表的的设计可以违反第三范式,增加冗余提高性能