熟悉数据,数据处理和数据库基本概念
数据的概念:数据(data)是对客观事物,事件的记录,描述,是可由人工或自动化手段加以处理的数字,文字,图形,图像和声音等符号的集合。
数据是描述客观事物的抽象表示和符号记录,信息表达方式和载体。是利用信息技术进行采集,处理,存储和传输的基本对象。
数据的概念包括两方面含义:一是数据的内容-含义(实质)是信息,二是数据的表现形式是符号(记录)。
数据处理:实惠数据进行加工的过程对数据进行的查询,分类,修改,变换,运算,统计等都属于加工。目的是根据需要,从大量的数据忠抽取出有意义、有价值数据(信息),作为决策和行动的依据,其实质是信息处理。
数据管理:是对原有基本数据进行管理为目的,在数据处理过程中,数据收集,存储,检索,分类、传输等基本环境统称为数据管理;
注意:数据处理与数据管理的区别:狭义上一般使数据发生较大根本性变化的数据加工称为数据处理(其他称为数据管理),如汇总,而广义上时常不加区别地统称为数据处理;
数据管理技术经过了那些阶段,各自的特点是什么?
- :1946年后计算机以电子管理为主要元器件,主要依靠硬件系统,工作效率低,用于计算且输入输出很少数据。
- 主要特点:
- 数据不保存;
- 数据面向应用;
- 数据无独立性;
- 无专门数据管理软件;
- :从20世纪30年代中期到60年代中期,计算机以晶体管取代了运算器和控制器中的电子管。出现了操在系统,编程语言和一些高级语言。计算机不仅限于科学计算,还大量用于管理等,在操作系统中有专门的数据管理软件,成为文件系统
- 主要特点
- 数据长久保存;
- 数据共享能力差;
- 数据不能独立;
- 数据管理功能简单;
缺陷
数据不共享冗余大。
数据不一致,不独立。
数据文件缺乏关联。
- :从20世纪60年代末到80年代,CPU向超大规模集成电路发展,操作系统得到了发展,而且各种DBMS软件不断涌现,使得数据库管理技术不断发展和完善,成为计算机领域中最具影响力和发展潜力,应用范围最广,成果最显著技术之一,形成了数据库时代
- 主要特点
- 数据整体结构化
- 数据高共享,低冗余
- 数据独立性高
- 数据统一由DBMS管理和控制
- :从20世纪80年代以后,传统数据库技术日趋成熟,并在各个领域的应用也逐渐深入,在网络技术和行业的新需求的不断推动下,数据库技术的发展呈现出前所未有的新气象,分布数据库,数据仓库,数据集市和商业智能等新技术纷纷涌现。
- 主要特点
- 物理分布性。
- 逻辑整体性
- 站点自治性
- 站点协作性
- 数据分布透明性。
- 存在适当的数据冗余度。
- 事务管理的分布性。
分布式数据库系统兼顾集中管理和分布处理两项任务
数据库系统有哪几部分组成?
一般由数据库,操作系统,数据管理系统(及其开发工具),应用系统,数据管理员及用户构成具有DB功能
数据库的最新发展趋势有那些?
- 数据继承与数据仓库。
- 主数据管理和商业智能。
- 基于网络的自动化管理。
- DBMS的自适应管理。
- 移动数据管理。
- 大数据-云数据库。
数据库模型
数据库模型是数据结构和特征的抽象描述(表示),是数据处理的关键和基础。用于现实世界中的数据特征的抽象,表示和处理,DBMS的实现都是建立在某种数据模型基础上的。
显示世界中的数据要转换为抽象的数据库数据,需要经过以下阶段:现实世界,信息世界和机器世界阶段。其转换过程,如图

数据模型由三要素组成:数据结构,数据操作和完整性约束。
- 数据结构。描述数据库的组成对象以及对象之间的联系,是所研究的对象类型的集合,是对系统的静态特征的说明。其描述内容包括两类,一是数据类型,内容,性质有关的对象,如关系模型(表格结构)中的域,属性,关系等;二是与数据之间关系有的对象。
- 数据操作。描述系统的动态特征,是对数据库中的各个对象的实例允许执行的操作的集合,包括操在及其有关规则。对数据的操作主要有数据维护和数据检索两大类,这是任何数据模型都必须规定的操作,包括操作符,含义,和规则等。
- 数据的约束条件。是一组完整性规则的集合。完成型规则是给定的数据模型中的数据及其联系所具有的制约和依存规则(条件和要求),用于限定符合数据模型的数据库状态及其变化,保证数据正确,相容和有效。
数据模型的类性按应用层次可分成:概念数据模型,逻辑数据模型,物理数据模型。
- 概念模型 也称信息模型,是面向数据库用户实现世界的模型。主要用于描述事物的概念化结构,使数据库的设计人员在设计的初期,避开计算机系统及DBMS具体技术问题,以图形化方式分析表示事物数据特征及其之间的联系等,最常见的是实体联系 模型(E-R)图
- 逻辑模型 是以计算机系统的观点对数据建模,是直接面向数据库的逻辑结构,是对客观现实世界的第二层抽象。是具体的DBMS所支持的数据模型,如网状模型,层次模型和关系模型等。
- 物理模型 是面向计算机物理表示的模型,描述数据在存储介质的组织结构,既与具体DBMS有关也与操作系统和硬件有关。如存储路径,方式,索引等。
什么是数据模型?数据模型的组成要素是什么?
- 是数据结构和特征的抽象描述(表示),是数据处理的关键和基础。
- 数据结构,数据操作和完整性约束。
ER图基本构件有那些?ER图在信息系统项目中起到的作用是什么?
- ER模型是一种用E-R图表示实体及其联系的方法,E-R图包含四种基本元素:矩形、菱形、椭圆形和连接线,矩形表示实体,菱形表示联系,椭圆形表示属性,连接线-表示实体、联系与属性之间的所属关系或实体与联系之间的相连关系。
- 避开计算机系统及DBMS具体技术问题,以图形化方式分析表示事物数据特征及其之间的联系等,最常见的是实体联系
数据模型的种类有那些?他们各自有什么特点?

C/S三层架构
实际应用中,出于系统安全性,稳定性和健壮性考虑,通常将数据库,应用服务器和客户端三层分开部署,称为C/S三层架构。包括表示层,应用层和数据层。三层架构比二层结构增加一个应用服务器层;
数据库的三级模式结构
数据库系统的三级模式结构包括外模式、模式(概念模式)和内模式,分别代表看待数据库的三个不同角度。在这三级模式之间还提供了外模式/模式映像、模式/内模式二级映像,保证数据的逻辑和物理独立性。三级模式结构如图

数据库执行图

数据库系统组成包括数据库、数据库管理系统(DBMS)、应用系统和用户四个部分
1)什么是数据库系统的三级模式结构?
2)什么是数据模式的二级映射?
外模式/模式映像定义了外模式和模式之间的对应关系。外模式描述数据的局部逻辑结构,模式描述数据的全局逻辑结构。数据库中的同一模式可以有多个外模式,对于每个外模式,都存在一个外模式/模式映像。
外模式和模式之间的对应关系称为映像。这些映像确定了数据的局部逻辑结构与全局逻辑结构之间的对应关系。当模式改变时(如增加新关系、新属性等),由数据库管理系统对个外模式/模式映像作相应改变,可保证外模式不变。应用程序是根据数据的外模式编写的,外模式没有变应用程序不需要修改,保证了数据的逻辑独立性(数据与程序之间的逻辑独立性)。
模式/内模式映像定义了数据的全局逻辑结构与存储结构之间的对应关系。数据库中的模式和内模式都只有一个,因此模式/内模式映像也是唯一的。应用程序依赖于数据的外模式,与数据的模式和存储结构独立,当数据库的存储结构发生了变化时,只需要数据管理员对模式/内模式的映像做相应改变,可以使模式保持不变,从而保证用户程序不需要改变,保证了数据的物理独立性。
3)数据库如何保证程序与数据的逻辑独立性?
数据与应用程序之间相互独立,可使数据的定义、描述和存取等问题与应用程序进行分离。此外,由于数据的存取由DBMS实现,用户不必考虑存取路径等问题,可以简化应用程序的编写,也减少应用程序的维护和修改。
1)DBMS的工作模式具体有哪些?
DBMS是对数据库进行统一操纵和管理的大型数据管理软件,主要功能是建立、使用和维护数据。它是数据库系统的核心和关键。用于统一管理控制数据库系统中的各种操作,包括数据定义、查询、更新及各种管理与控制,都是通过DBMS进行的。DBMS的工作模式示意图如图1-18所示

2)请概述DBMS的主要具体功能?
1)数据定义功能。DBMS提供数据定义语言(Data Definition Language,DDL)。用户通过DDL完成对数据库中数据对象的定义,如定义对象:数据库、表、视图等。
2)数据存取功能。DBMS提供数据操作语言(Data Manipulation Language,DML)。用户可用DML实现对数据库的基本操作,如检索、插入、删除和修改等。
3)运行管理功能。DBMS提供数据控制和管理功能,对数据库进行有效地控制和管理,实现数据的安全性、完整性、并发性控制和故障恢复,确保数据正确有效。
4)数据组织、管理和存储。DBMS要对各种数据进行分类组织、管理和存储,包括用户数据、数据字典、数据存取路径等。确定文件结构种类、存取方式(索引查找、哈希查找、顺序查找等)和数据的组织,实现数据之间的联系等,提高了存储空间的利用率和存取效率。
5)数据库的建立和维护功能。包括:数据库的初始建立、数据的转换、数据库的转储和恢复、数据库的重新组织功能、性能监视和分析功能等。上述功能主要由一些实用软件或管理工具完成。
6)其他功能。主要包括以下几点:DBMS与其他软件系统的数据通信功能;不同DBMS或文件系统的数据转换功能,异构数据库之间的互访和互操作功能等。
3)DBMS模块组成有哪几方面?
DBMS是一个复杂的软件系统,由许多模块组成。由于DBMS的用途、版本及复杂程度各异,其程序不尽相同,按程序实现的功能可分为4部分:
1)语言编译处理程序。含数据定义语言(Data Definition Language,DDL)、数据操作语言(Data Manipulation Language,DML)、数据控制语言(Data Control Language,DCL)和事务管理语言(Transact Management Language,TML)功能及其编译程序。
2)系统运行控制程序。主要包括:系统总控程序、安全性控制程序完整性控制程序、并发控制程序、数据存取和更新程序和通信控制程序。
3)系统建立与维护程序。主要包括:装配程序、重组程序和系统恢复程序。
4)数据字典。对于用户为一组只读的表,其内容包括数据库中所有模式对象特征的描述信息,如表、视图及索引等。包括来自用户的信息、系统状态信息和数据库的统计信息等。