1.数据库是存储在计算机存储设备中的、结构化的相关数据的集合。数据库中的数据不只是面向某一项特定的应用,而是面向多种应用,可以被多个用户、多个应用程序共享,不具有独立的系统。设计数据库的目的实质上是设计出满足实际应用需求的实际关系模型。
2.数据库技术的主要目的是有效地管理和存取大量的数据资源,包括:提高数据的共享性,使多个用户能够同时访问数据库中的数据;减小数据的冗余,以提高数据的一致性和完整性;提供数据与应用程序的独立性,从而减少应用程序的开发和维护代价。
3.数据库系统阶段的特点:数据结构化,数据独立性高,数据共享性高,冗余度小,易于扩充,数据库管理系统提供统一的数控制功能,包括数据安全性、完整性、并发控制和数据恢复功能
3.数据库管理系统的三级模式结构由外模式、模式和内模式组成。
外模式,或子模式,或用户模式,是指数据库用户所看到的数据结构,是用户看到的数据视图。
模式,或逻辑模式,是数据库中对全体数据的逻辑结构和特性的描述,是所有用户所见到的数据视图的总和。外模式是模式的一部分。
内模式,或存储模式,或物理模式,是指数据在数据库系统内的存储介质上的表示,即对数据的物理结构和存取方式的描述。
内模式(Internal Schema)又称物理模式(Physical Schema),它给出了数据库物理存储结构与物理存取方法,如数据存储的文件结构、索引、集簇及hash等存取方式与存取路径。
4.由于数据的集成性使得数据可为多个应用所共享,特别是在网络发达的今天,数据库与网络的结合扩大了数据关系的应用范围。数据的共享自身又可极大地减少数据冗余性,不仅减少了不必要的存储空间,更为重要的是可以避免数据的不一致性。所谓数据的一致性是指在系统中同一数据的不同出现应保持相同的值,而数据的不一致性指的是同一个数据在系统的不同拷贝处有不同的值。
数据库设计可分为概念设计与逻辑设计。
数据库概念设计的目的是分析数据间内在语义关联,在此基础上建立一个数据的抽象模型。
数据库逻辑设计的主要工作是将ER图转换为指定的RDBMS中的关系模型。
5.数据库概念设计的过程中,视图设计一般有三种设计次序,它们是:
自顶向下。这种方法是先从抽象级别高且普遍性强的对象开始逐步细化、具体化与特殊化。
由底向上。这种设计方法是先从具体的对象开始,逐步抽象,普遍化与一般化,最后形成一个完整的视图设计。
由内向外。这种设计方法是先从最基本与最明显的对象着手逐步扩充至非基本、不明显的其它对象。
6.在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。其中数据独立性最高的阶段是数据库系统。
人工管理阶段的特点:数据不保存、数据不独立、数据不能共享、数据无结构,没有专门的数据管理软件。
7.文件系统阶段的特点:数据可以长期保存,有专门的数据管理软件--文件系统。但是数据独立性低,共享性差、冗余度大,数据记录内有结构,整体无结构。
8.层次模型是最早发展出来的数据库模型。它的基本结构是树形结构,这种结构方式在现实世界中很普遍,如家族结构、行政组织机构,它们自顶向下、层次分明。
9.在关系数据库中,关系模型采用二维表来表示,简称"表"。二维表是由表框架及表元组组成。在表框架中,按行可以存放数据,每行数据称为元组。
10.关系数据库管理系统能实现的专门关系运算,包括选择运算、投影运算、连接运算。
选择:从关系中找出满足给定条件的元组的操作称为选择。选择是从行的角度进行的运算,即从水平方向抽取记录。
投影:从关系模式中指定若干个属性组成新的关系。投影是从列的角度进行的运算,相当于对关系进行垂直分解。
连接:连接是关系的横向结合。连接运算将两个关系模式拼接成一个更宽的关系模式,生成的新关系中包含满足连接条件的元组。连接过程是通过连接条件来控制的,连接条件中将出现两个表中的公共属性名,或者具有相同语义、可比的属性。选择和投影运算的操作对象只是一个表。相当于对一个二维表进行切割。连接运算需要两个表作为操作对象。
11.选择运算是一个一元运算,关系R通过选择运算(并由该运算给出所选择的逻辑条件)后仍为一个关系。这个关系是由R中那些满足逻辑条件的元组所组成。如果关系的逻辑条件为f,则R满足f的选择运算可以写成:бf(R)。
12.结构化查询语言(Structured Query Language,简称SQL)是集数据定义、数据操纵和数据控制功能于一体的数据库语言
13.数据结构概念一般包括3个方面的内容,数据的逻辑结构、存储结构及数据上的运算集合。数据的逻辑结构只抽象的反映数据元素之间的逻辑关系,而不管它在计算机中的存储表示形式。
14.数据处理的最小单位是数据项;由若干数据项组成数据元素;而数据是指能够被计算机识别、存储和加工处理的信息载体;数据结构是指数据之间的相互关系和数据运算。
15.数据库(Database,简称DB)是数据的集合,它具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序所共享。数据库中的数据具有"集成"、"共享"之特点。
16.由于数据的集成性使得数据可为多个应用所共享,特别是在网络发达的今天,数据库与网络的结合扩大了数据关系的应用范围。数据的共享本身又可极大地减少数据冗余性,不仅减少了不必要的存储空间,更为重要的是可以避免数据的不一致性。因此,数据库设计的根本目标是要解决数据共享问题。
17.在文件系统中,相互独立的记录其内部结构的最简单形式是等长同格式记录的集合,易造成存储空间大量浪费,不方便使用。而在数据库系统中,数据是结构化的,这种结构化要求在描述数据时不仅描述数据本身,还要描述数据间的关系,这正是通过采用特定的数据模型来实现的
18.外模式是用户的数据视图,也就是用户所见到的数据模式;全局数据视图的描述称为概念模式,即数据库中全部数据的整体逻辑结构的描述;物理存储数据视图的描述称为内模式,即数据库在物理存储方面的描述;存储模式即为内模式。
19.分布式数据库系统具有数据分布性、逻辑整体性、位置透明性和复制透明性的特点,其数据也是分布的;但分布式数据库系统中数据经常重复存储,数据也并非必须重复存储,主要视数据的分配模式而定。若分配模式是一对多,即一个片段分配到多个场地存放,则是冗余的数据库,否则是非冗余的数据库。
20.数据模型所描述的内容有3个部分,它们是数据结构、数据操作和数据约束。其中,数据模型中的数据结构主要描述数据的类型、内容、性质,以及数据库的联系等;数据操作主要是描述在相应数据结构上的操作类型与操作方式。
21.数据独立性是数据与程序间的互不依赖性,即数据库中数据独立于应用程序而不依赖于应用程序。也就是说,数据的逻辑结构、存储结构与存取方式的改变不会影响应用程序。
22.层次模型是最早发展起来的数据库模型,它的基本结构是树形结构。
23.数据库管理系统DBMS是数据库系统的核心。DBMS是负责数据库的建立、使用和维护的软件。DBMS建立在操作系统之上,实施对数据库的统一管理和控制。用户使用的各种数据库命令以及应用程序的执行,最终都必须通过DBMS。另外,DBMS还承担着数据库的安全保护工作,按照DBA所规定的要求,保证数据库的完整性和安全性。
24.数据库管理系统是数据库的机构,它是一种系统软件,负责数据库中的数据组织、数据操纵、数据维护、控制及保护和数据服务等。
25.数据定义语言(DDL):该语言负责数据的模式定义与数据的物理存取构建。
数据操纵语言(DML):该语言负责数据的操纵,包括查询及增、删、改等操作。
数据控制语言(DCL):该语言负责数据完整性、安全性的定义与检查以及并发控制、故障恢复等功能。
26.两个实体间的联系可以归纳为3种类型:
一对一联系:一对一的联系表现为主表中的每一条记录只与相关表中的一条记录相关联。
一对多联系:一对多的联系表现为主表中的每一条记录与相关表中的多条记录相关联。
多对多联系:多对多的联系表现为一个表中的多个记录在相关表中同样有多个记录其匹配。
27.E-R图中用矩形表示实体集,用椭圆表示属性,用菱形表示联系。
将E-R图转换为关系模式时,实体和联系都可以表示成关系,E-R图中属性也可以转换成关系的属性。实体集也可以转换成关系。
E-R图是E-R模型的一种非常直观的图的形式表示,它描述信息结构但不涉及信息在计算机中的表示,它是数据库概念设计阶段的工具。
28.数据库系统由如下几部分组成:数据库、数据库管理系统、数据库管理员、系统平台(硬件平台和软件平台)。
29.数据库设计分为以下6个设计阶段:需求分析阶段、概念设计阶段、逻辑设计阶段、物理设计阶段、实施阶段及数据库运行和维护阶段。
30.数据库物理设计的主要目标是对数据库内部物理结构作调整并选择合理的存取路径,以提高数据库访问速度及有效利用存储空间。物理设计的内容有索引设计、集簇设计和分区设计等
31.数据库的逻辑设计主要工作是将E-R图转换成指定的RDBMS中的关系模式。
32.对关系数据库进行查询时,需要找到用户感兴趣的数据,这就需要对关系进行一定的关系运算。关系的基本运算有两类:一类是传统的集合运算(并、交、差),另一类是专门的关系运算(选择、投影、连接)。集合的并、交、差:设有两个关系R和S,它们具有相同的结构,R和S的并是由属于R和S,或者同时属于R和S的所有元组成的集合,记作R∪S;R和S的交是由既属于R又属于S的所有元组组成的集合,记作R∩S;R和S的差是由属于R但不属于S的所有元组组成的集合,记作R-S 。
33.连接运算将两个关系模式拼接成一个更宽的关系模式,生成的新关系中包含满足连接条件的元组。在连接运算中,按照字段值对应相等为条件进行的连接操作称为等值连接。自然连接是指去掉重复属性的等值连接。
34.传统的集合运算包括:并、差、交,且两个关系必须具有相同的关系模式,即相同结构。并是由属于这两个关系的元组组成的集合。交运算的结果是这两个关系的共同元组。
交:设关系R和关系S具有相同的目n,且相应的属性取自同一个域,则关系R与关系S的交由属于R又属于S的所有元组组成。
并:设关系R和关系S具有相同的目n(即两个关系都有n个属性),且相应的属性取自同一个域,则关系R与关系S的并由属于R或属于S的元组组成。
35.自然连接:是一种特殊的等值连接,它要求两个关系中进行比较的分量必须有相同的属性组,并且要在结果中把重复的属性去掉。
选择是从行的角度进行的运算,即从水平方向抽取记录。
自然连接运算表示为R|×|S,要求关系R和S有公共域,并且通过公共域的相等值进行连接。除法运算表示为R÷S,要求R中的域包含S中的所有属性,并且R中有一些域不出现在S中。差运算表示为R-S,表示在关系R中删除关系S中的记录。
36.选择运算也是一个一元运算,关系R通过选择运算后仍为一个关系。这个关系是由R中那些满足逻辑条件的元组组成。设关系的逻辑条件为F,则R满足F的选择运算可写成为: 逻辑条件F是一个逻辑表达式,它由下面的规则组成。
它可以是具有αθβ的形式,其中α、β是域或常量,但α、β又能同为常量,θ是比较符,它可以是<,>,≤,≥,=及≠。α、θ、β叫基本逻辑条件。
37.由若干个基本逻辑条件经逻辑运算得到,逻辑运算为^(并且),∨(或者)及~(否)构成,称为复合逻辑条件。
38.数据库系统具有数据独立性的特点,数据独立性一般分为物理独立性与逻辑独立性两级。物理独立性即数据的物理结构的改变都不影响数据库的逻辑结构;逻辑独立性即数据库总体逻辑结构的改变,不需要相应修改应用程序。所以,在数据系统中,数据的物理结构并不一定与逻辑结构一致。
39.数据库应用系统是数据库系统再加上应用软件及应用界面这三者所组成,具体包括:数据库、数据库管理系统、数据库管理员、硬件平台、软件平台、应用软件、应用界面。在数据库应用系统中的一个核心问题就是设计一个能满足用户要求,性能良好的数据库,这就是数据库设计。
40.数据库系统的基本特点:1.数据的高集成性;2.数据的高共享性与低冗余性;3.数据高独立性;4.数据统一管理与控制。
41.为了建立一个关系,首先要指定关系的属性。表示关系的二维表中各元组的每一个分量必须是不可分的基本数据项。在关系数据库中,把数据表示成二维表,而一个二维表就是一个关系。一个关系的属性名表称为该关系的关系模式,其记法为:<关系名>(<属性名1>,<属性名2>,…,<属性名n>)。
42.能惟一标识实体的属性集称为码(关键字)。码也称为关键字,是表中若干属性的属性组,其值惟一标识表中的一个元组。
43.实体是概念世界中的基本单位,属性附属于实体,它本身并不构成独立单位。属性有属性域,每个实体可取属性域内的值。一个实体的所有属性取值组成了一个值集叫元组(或称记录)。在概念世界中,可以用元组表示实体,也可用它区别不同的实体。所以在学生管理的关系数据库中,存取一个学生信息的数据单位是元组(或记录)。
44.笛卡尔积:设关系R和S的元数分别是r和s,定义R和S的笛卡尔积是一个(r+s)元元组的集合,每一个元组的前r个分量来自R的一个元组,后s个分量来自S的一个元组。若R有k1个元组,s有k2个元组,则关系R和关系S的广义笛卡尔积有k1×k2个元组。
45.数据库管理系统所支持的数据模型分为三种:层次模型、网状模型、关系模型。
层次数据模型:用树形结构表示实体及其之间联系的模型称为层次模型。
网状模型:用网状结构表示实体及其之间联系的模型称为网状模型。
关系数据模型:用二维表结构来表示实体以及实体之间联系的模型称为关系模型。
逻辑数据模型又称数据模型,它是一种面向数据库系统的模型,该模型着重于在数据库系统一级的实现。逻辑模型也称为数据模型,数据模型分为3种:层次、网状、关系模型
46.实体完整性是保证表中记录惟一的特性,即在一个表中不允许有重复的记录。如果一个字段的值或几个字段的值能够惟一标识表中的一条记录,则这样的字段称为候选关键字。在一个表上可能会有几个具有这种特性的字段或字段的组合,这时从中选择一个作为主关键字。因此在满足实体完整性约束的条件下,一个关系中不可以没有候选关键字。一个关系中可以有一个或多个候选关键字
47.实体完整性约束要求关系的主键中的属性值不能为空值,这是数据库完整性的最基本要求,因为主键是唯一决定记录的,如为空值则其唯一性就成为不可能的了。
48.参照完整性约束是关系之间相关联的基本约束,它不允许关系引用不存在的记录,即在关系中的外键要么是所关联关系中实际存在的记录,要么就为空值。
49.在二维表中凡能唯一标识元组的最小属性集称为该表的键或码。二维表中可能有若干个键,它们称为该表的候选码或候选键。从二维表中的所有候选键中选取一个作为用户使用的键称为主键或主码。表A中的某属性集是某表B的键,则称该属性集为A的外键或外码。
50.概念数据模型是一种面向客观世界、面向用户的模型,着重于对客观世界复杂事物的结构描述及它们之间的内在联系的刻画。概念数据模型与具体的数据库管理系统无关,与具体的计算机平台无关。
51.物理数据模型又称物理模型,它是一种面向计算机物理表示的模型,此模型给出了数据模型在计算机上物理结构的表示。
52.数据模型从抽象上描述了数据库系统的静态特征、动态行为和约束条件,因此数据模型通常由数据结构、数据操作和数据约束三部分组成。
53.逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,即当数据的逻辑结构改变时,用户程序也可以不变
54.数据库中的数据是有结构的,这种结构由数据库管理系统所支持的数据模型表现出来。数据库系统不仅可以表示事物内部各数据项之间的联系,而且可以表示事物与事物之间的联系,从而反映出现实世界事物之间的联系。
55.以关系数据库系统为例,数据库中的数据存储在二维表中,表由记录构成,每个记录都有相同的结构,既每个记录所包含的属性类型相同,而取值不同,因此可以肯定数据库中的记录之间存在联系。
56.数据库中的数据项,也就是二维表的字段,而在数据库的表中,通常会设定某个字段或某些字段为键,通过这些键就可以确定其他字段的值,既数据库中的数据项之间也存在一定的关系,因此,数据库的数据项之间以及记录之间都存在联系。
57.数据库(Database,简称DB)是有结构的数据的集合,它具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序所共享。
58.数据库技术是在文件系统基础上发展产生的,两者都以数据文件的形式组织数据,但由于数据库系统在文件系统之上加入了DBMS对数据库进行管理,从而使得数据库系统具有以下特点:数据的继承性;数据的高共享性和低冗余性;数据独立性;数据统一管理与控制。
59.数据模式是数据库系统中数据结构的一种表示形式,它具有不同的层次与结构方式。概念级,是数据库系统中全局数据逻辑结构的描述,是全体用户公共数据视图;用户级,是用户的数据视图,也就是用户所见到的数据模式,它由概念模式推导而出;存储级,给出了数据库物理存储结构与物理存取方法。
60.数据库的三级模式结构包括:概念模式、内模式、外模式。概念模式,是数据库系统中全局数据逻辑结构的描述,是全体用户公共数据视图。外模式也称为子模式或用户模式。它是用户的数据视图,也就是用户所见到的数据模式,它由概念模式推导而出。内模式又称物理模式,它给出了数据库物理存储结构与物理存取方法。
外模式也称子模式或用户模式。它是用户的数据视图,也就是用户所见到的数据模式,它由概念模式推导而出。概念模式给出了系统全局的数据描述而外模式则给出每个用户的局部数据描述。一个概念模式可以有若干个外模式,每个用户只关心与它有关的模式,这样不仅可以屏蔽大量无关信息而且有利于数据保护
内模式又称为物理模式,它是数据库中全体数据的内部表示或底层描述,它是唯一的,而建立在数据库系统之上的应用则是非常广泛的、多样的,因此外模式不是唯一的,也不可能是唯一的。
61.数据模型的三个要素是数据结构、数据操作、数据约束。
62.关系的完整性包括实体完整性、参照完整性、用户自定义完整性。
最近一直在忙着考试什么的,瘫了几天的我终于更新啦,各位实在不好意思啦,如果大家喜欢我的文章就点个赞哦,有钱捧个钱场,没钱捧个人场~