数据是对事物和概念的描述,它的最初表示形式是符号。信息是对数据的理解或解释。数据是信息的载体,信息是数据的内涵。
数据管理:对数据进行收集、整理、存储、检索、加工和传递等一系列活动的总和。其目的是从数据中获取有效的信息。
计算机数据管理技术经历了人工管理、文件管理和数据库系统三个阶段:
1.人工管理:
缺点:数据不保存、不共享、数据冗余度大、没有数据独立性和数据的不统一性。
2.文件系统:
缺点:数据共享性较差、数据的冗余度较大、数据存在不一致性和数据的独立性差(只实现了数据的物理独立,没有实现数据的逻辑独立)。
3.数据库系统:
特点:
1.数据结构化:描述数据时不仅描述数据本身,还描述数据之间的联系。
2.数据共享度高
3.数据冗余度低:数据库系统可以把数据冗余控制在最少,系统也可保留必要的数据冗余。
4.数据一致性高:同一数据的不同拷贝的值是一样的。
5.系统弹性大,易扩充
6.数据独立性高:物理独立性是指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。数据独立性是由数据库系统的二级映像功能来保证的。
7.数据由DBMS统一管理:提供数据安全性保护、数据完整性检查、并发控制和数据恢复的功能。
数据库(DB):长期存储在计算机内的、相互联系的数据集合,按一定的数据模型组织,较小的冗余度,较高的独立性,可共享。
数据库管理系统(DBMS):位于用户和操作系统之间的数据管理软件。功能:存储数据、数据定义、数据操纵、事务管理、数据库的运行管理、数据库维护功能。
数据库系统(DBS):计算机系统中引入数据库后的系统,一般由数据库,DBMS(及其开发工具)、应用系统、数据库用户和管理员构成。
三级模式:
1.模式:也称为逻辑模式、概念模式,是对数据库中的全体数据的逻辑结构和特征的描述,是对所有用户的公用数据视图,一个数据库只有一个模式。
2.外模式:也称为子模式或用户模式,是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是与某一应用有关的数据的逻辑表示,一个数据库可以有多个外模式。
3.内模式:也称为存储模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式。
两级映像:
1.外模式-模式映像:模式可以有多个外模式,每个外模式都有一个外模式-模式映像,定义了该外模式与模式之间的对应关系。外模式-模式映像是通过对外模式的定义实现的,即在用DBMS的外模式定义语言定义外模式时,该外模式的外模式-模式映像即已建立。
外模式-模式映像保证了数据库系统中的数据具有较高的逻辑独立性。
2.模式-内模式映像:定义了数据库的全局逻辑结构与存储结构之间的对应关系,它是通过对模式的定义实现的,即在用DBMS的模式定义语言定义模式时,模式-内模式映像即已建立。
模式-内模式映像保证了数据库系统中的数据具有较高的物理独立性。
数据模型:是现实世界数据特征的抽象,其作用是用高度抽象的方法表示数据之间的关系。
数据模型的分类:第一类模型是语义数据模型,也称为概念模型,常用的语义数据模型有实体联系模型(E-R模型)、面向对象模型等。第二类模型是经典数据模型,也成为数据模型,主要包括网状模型、层次模型、关系模型等。
数据模型的构成元素:
1.数据结构:数据库中的数据的组成、特性及其相互间的联系。
2.数据操作:数据库中各种对象的实例允许的操作的集合,包括操作及有关的操作规则。
3.约束条件:数据完整性规则的集合,给定数据模型中数据及其联系所具有的制约和依存规则,用于限定符合数据模型的数据库状态及其变化,以保证数据的完整性。
关系模型:
关系模型中数据的逻辑结构就是一张二维表。
元组:二维表中的一行,描述一个具体实体,在关系数据库中称为记录。
属性:二维表中的一列,,在关系数据库中称为数据项或字段。
主码:二维表中能唯一标识一个元组的属性或属性集。
域:属性的取值范围。
关系:元组的集合,描述一个实体集中的各个实体,在关系数据库中也称为表。
关系模型的操作主要包含查询、插入、删除和修改数据等。关系的完整性约束包括实体完整性、参照完整性和用户定义的完整性。