数据库系统工程师复习笔记-数据库范式

首先,有一个关系模式:学生信息(班级号,姓名,性别,座位号,班主任教工号),

该学校的班级号唯一,但可能同班会出现同名学生,每个学生只属于一个班级且有固定的位置,每个班级只有一名教师。

根据以上条件,不难发现(班级号、座位号)构成了(候选)码,且只有这一个候选码能推出其他非主属性,码中的属性(班级号或座位号)都称为主属性,而只要不在任意一个候选码中的属性,都称为非主属性。该关系模式R<U,F> ,U={班级号,姓名,性别,座位号,班主任教工号},F={班级号+座位号->姓名,班级号+座位号->性别,班级号->班主任教工号}。这个关系模式满足1NF,但是不满足2NF,因为它出现“非主属性”不完全依赖于码(班级号、座位号),即班级号->班主任教工号只依赖于候选码的部分主属性,称为部分依赖。

一个数据对象对应于数据库对应表的一个元组(即表中的一行)。只要某一个对象(元组)它不存在同一个表中存在多值属性,这个表就满足1NF。即保证每个对象在同一个表中的列原子性(不可再分,且唯一,不出现冗余)。(根据码判断是否是同一个对象,一个码可以设置一个至多个主键,即复合主键。或称为主属性

以下学生模式1,三个对象,每个对象的每一列都是唯一的。(不要受年龄重复而影响判断,他们不是一个对象!!!这个冗余是允许的)

学生模式

函数依赖为 F={学号->年龄,学号->手机}

接下来反规范化,模式二,允许任意对象产生多值属性:

学生模式1

对象001在手机列上产生了多值属性,它不满足1NF。消除多值依赖,正确的关系模式应根据主码重组关系模式,且保持依赖。所以设置主码“学号”,设计为以下关系模式:

学生模式二

还有另外两类属性:复合属性、派生属性,虽然它们的存在不会导致范式降级,但是在“同一个表”中这种属性要尽量避免出现。

复合属性:如家庭住址(xx省xx市xx区)可以分为三个字段。

派生属性:如年龄和出生日期,根据出生日期可以推导出年龄,年龄是派生属性。

--------------------------------------------------------

上面的 学生信息 关系模式不满足2NF,现在为了保持函数依赖(班级号->班主任教工号),重组关系模式为:

重组学生信息关系模式

这样,每个表都满足满足2NF,且不存在部分依赖。现在暂时不评判它达到第几范式。

----------------------------------------------------------

下面,再造一个关系模式,使其不满足3NF(3NF:消除非主属性对主属性的传递依赖)。

学生信息2

这为某个学校的学生信息表。该学校的学生在该学校的学号唯一。

由题可得:由于系号在多个对象(学生)信息上存在冗余,不计入候选码。R<U,F>为,U={学号,姓名,身份证号,系号,系名称},F={学号->姓名,学号->身份证号,身份证号->学号,学号->系名,系号->系名称}。即候选码有两个(学号)和(身份证号),这两个属性都是主属性。由于候选码唯一确定的每个对象,每个学生是一个对象,在该对象的任意列上不存在冗余,即没有多值属性,满足1NF。

非主属性(不在任意候选码中的属性)姓名、系号 完全依赖于码(学号)或(身份证号),满足2NF。这里系名称不直接依赖于码,也不部分依赖于码,即它的存在并不会产生“部分依赖”,不会对2NF范式产生范式降级影响。

由于候选码中存在:学号->系号->系名称  的传递依赖,不满足3NF。即范式最大为2NF。

现在将它升级为3NF但不满足BCNF,如下:

学生信息3

模式中不存在非主属性对主属性的传递依赖,即3NF。

关系模式分解之后,保持函数依赖,即为无损分解。R1∩R2 -> R1-R2  或  R1∩R2 -> R2-R1。

若学生信息3=R1,系信息表=R2,则R1∩R2推出系号,R1-R2=R1 (Except操作{Union/UnionAll/InterCept}) R2={学号,姓名,身份证号},R2-R1={系名称}。根据原函数依赖集合F+={学号->姓名,学号->身份证号,身份证号->学号,学号->系名,系号->系名称},满足R1∩R2 -> R2-R1,即系号->系名称,所以该关系模式重组属于无损分解。

---------------------------------------------------

以下根据网上的例子造一个满足3NF但不满足BCNF的范式。

假设有个关系模式学生信息4(A,B,C,D),有R<U={ABCD},F={A->C,C->A,AB->D,BC->D}>

示范ABCD

那么该关系模式的候选键为AB(或BC),非主属性为D。由于表中不存在多值属性,满足1NF。表中不存在部分依赖,即非主属性完全依赖于码AB或BC,而不是依赖于A/B/C其中的一个,满足2NF。表中不存在非主属性对码AB或BC的传递依赖,满足3NF。BCNF需要解决主属性对码的传递依赖,但根据题中,选AB做主码时(->表示推导) ,AB->A->C,主属性C对码AB具有传递依赖,若选BC做主码时,BC->C->A,主属性A对码BC具有传递依赖。简单来讲,有多组候选码的关系模式(即单表)一般情况下会比较难达到BCNF,除非消除多个候选码中主属性决定主属性的情况。

所以为了解决这种情况,表设计的时候仅能存在一组候选码是最好的。或者将多组候选码中“主属性决定主属性”的其中一个主属性去掉。即下图:

示范ABCD2

----------------------------------------------------------

一般情况下,数据库设计满足3NF即可,严格点就BCNF,很少会达到4NF往上。当然,现在讲下4NF。

首先,“->->”这个符号是多值依赖,即一对多,如一个学生有多个手机号写成“学号->->手机号”。(“->”表示函数依赖,属于单值依赖,不能表达一对多)

其次,理解非平凡的多值依赖和平凡的多值依赖:有R<U,F>,U={A,B,C},F+={A->->B,A->->C},

如一个求职者在某个公司应聘多个职位,每个人只有一个求职编码;不同职位应聘场地不同;每个应聘场地的面试官不固定在一个应聘场地,可能会出现在另一个场地。表数据大概如下:

求职者面试表

我已经写出来了两个1:N的关系AB和AC。非平凡的多值依赖一个表中存在多个一对多关系,或者理解这张表叫做中间表,即表中存在多对多的关系。平凡的多值依赖,就是这张表中只能有一组一对多关系,即一组多值依赖。分解如下:   

求职者面试表重组关系模式

总结:第四范式即在满足巴斯-科德范式(BCNF)的基础上,消除非平凡的多值依赖,且消除非函数依赖的多值依赖(非函数依赖的多值依赖面试场地->->面试官,这个依赖不属于函数F+,即把同一表内的多对多关系删除)

------------------------------------------------------------------

至此,第一范式、第二范式、第三范式、BC范式和第四范式总结完成。后续补充第五范式。

------------------------------------------------------------------

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353

推荐阅读更多精彩内容

  • 第一章 绪论 4个基本概念:数据、数据库、数据库管理系统、数据库系统 数据:描述事物的符号记录 数据的含义称为数据...
    Azur_wxj阅读 5,819评论 0 27
  • 18.7.24一、概念在创建一个数据库的过程中,必须依照一定的准则,这些准则被称为范式,从第一到第六共六个范式。二...
    静心安分读书阅读 10,996评论 0 2
  • title: 数据库复习小记date: 2020-07-06 09:48:28 [TOC] 0. 前言 大三下,只...
    dounine阅读 924评论 0 2
  • 需要了解的一些前置定义: 域:一些相同类型数据的集合例如:自然数,整数是一个域,{男,女}也是一个域 笛卡尔积:有...
    极尽愉悦阅读 1,242评论 2 3
  • 各范式关系图 在设计与操作维护数据库时,最关键的问题就是要确保数据能够正确地分布到数据库的表中。使用正确的数据结构...
    mr_酱阅读 636评论 0 1