数据库系统提供了数据定义语言DDL描述数据库schema,数据操作语言DML来表示数据库查询和更新。
在实践中,DDL和DML不是两个单独的语言,而是简单地构成了一门数据库语言的部分,比如SQL语言。
几乎所有的关系数据库都使用SQL语言。
1.4.1 数据定义语言
我们使用DDL来描述数据库schema以及数据的其他性质。
我们使用一类特殊的DDL语言,即数据存储和定义语言来描述存储结构以及数据库系统使用的访问方法。这类特殊的DDL语言定义了数据库schema的实现细节,通常是对用户隐藏的。
在数据库中存储的数据值必须满足某些一致性约束。比如,一个大学要求一个系的账户余额必须永不为负数。
DDL提供了工具来描述这些约束。
每当数据库更新时,数据库系统必须检查这些约束。
虽然,一个约束可以是任何一个判断,但是测试任意的判断是有开销的。
因此,数据库实现的仅是那些具有最小测试开销的约束,比如:
- 定义域约束
- 引用约束
- 权限约束
DDL语句的处理会有一些输出。
DDL的输出被放在数据字典里。
1.4.2 SQL数据定义语言
SQL提供了丰富的DDL来支持定义表及数据类型和完整性约束。
create table department (dept_name char(20), building char(15), budget numric(12,2));
执行前面的DDL语句,会创建一张有3列(dept_name、building、budget)的department表,其中每列都关联有具体的数据类型。
SQL DDL也支持若干类型的完整性约束。比如,主键约束,你可以设置dept_name的属性值是一个主键,保证没有两个系有相同的系名称。再比如,外键约束,你可以描述在任何一个instructor记录里的dept_name属性值必须出现在department表中的某个记录的dept_name属性里。
1.4.3 数据操作语言
数据查询语言DML是一门能使用户访问和操作根据数据模型组织的数据。
数据查询语言支持的访问类型有:
- 检索存储在数据库中的信息
- 向数据库中插入信息
- 从数据库中删除信息
- 修改存储在数据库中的信息
有两种类型的数据操作语言:
- 过程式DML
要求用户描述需要什么样的数据以及如何获取那些数据; - 声明式DML
要求用户描述需要什么样的数据,但不用描述如何获取那些数据
跟过程式DML相比,声明式DML更容易学习和使用。
既然用户不用描述如何获取数据,则数据库系统必须找出有效访问数据的方式。数据库系统中的查询处理器组件负责将DML查询转换成物理层的操作序列。
不管是在商业上,还是实验室里,在使用的数据库查询语言有多个。我们研究的是使用最广泛的SQL查询语言。
在1.3节里讨论的数据抽象分层不仅可以用来定义或者结构化数据,而且可以用来操作数据。在物理层抽象,我们必须定义支持有效访问数据的算法。在更高的抽象层中,我们更强调易用性,目标是支持人们跟数据库系统有效地交互。
1.4.4 SQL数据查询语言
SQL查询语言不是过程式语言。
一次查询的输入是几张表,有可能是一张。
一次查询的返回通常是一张表。
示例1 输入是一张表的查询:找出历史系的所有教员的姓名
select name from instructor where dept_name = 'History';
示例2 输入是多张表的查询:找出预算大于95000美元的系里所有教员的ID
以及系名称
select instructor.ID, department.dept_name from instructor, department where instructor.dept_name = department.dept_name and department.budget > 95000;
1.4.5 从应用程序中进行数据库访问
SQL VS 通用的图灵机
诸如SQL等声明式查询语言没有通用的图灵机器功能强大,即有些计算使用SQL是无法实现的。
SQL也不支持一些操作,比如接受来自用户的输入、输出结果到显示器、网络通信。
这些SQL无法实现的操作必须使用主机语言并嵌入SQL查询来编写,比如C++、Java、Python等,这是跟数据库交互的程序的实现方式,比如在大学中用来支持学生注册课程、生成班级名册、计算GPA、生成支付账单等的程序。
为了访问数据库,DML语句需要从主机语言中发出,在数据库中执行。最常见的是使用一个应用程序接口API来实现,该API能用来发送DML和DDL语句到数据库和检索结果。ODBC标准定义了C语言及其他语言跟数据库交互使用的API。JDBC标准定义了Java语言跟数据库交互使用的API。
总结:
DDL和DML跟数据模型之间的关系
SQL VS 编程语言
数据定义语言
描述数据库的schema以及数据的额外性质(比如完整性约束等)
数据操作语言
使得用户能访问或者操作按照数据模型描述组织的数据。