概念
什么是数据库
定义:数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。
注意:误用导致混淆
人们通常用数据库这个术语来代表他们使用的数据库软件,这是不正确的,也因此产生了许多混淆。确切地说,数据库软件应称为数据库管理系统(即DBMS)。数据库是通过DBMS创建和操纵的容器,而具体它究竟是什么,形式如何,各种数据库都不一样。
数据库特点:
如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改、查由统一软件进行管理和控制。
以一定的数据模型组织、描述和储存在一起、具有尽可能小的冗余度,较高的数据独立性和易扩展性的特点并可在一定范围内为多个用户共享。
- 实现数据共享
组织的、可共享的数据集合。
TCP/IP协议链接。 - 减少数据的冗余度
共享,关联,唯一。 - 子查询
SQL还允许创建子查询(subquery),即嵌套在其他查询中的查询。 - 联结
SQL最强大的功能之一就是能在数据查询的执行中联结(join)表。 - 关系表
关系表的设计就是要把信息分解成多个表,一类数据一个表。各表通过某些共同的值互相关联(所以才叫关系数据库)。 - 数据的独立性
应用程序和数据结构之间相互独立, 互不影响。 - 数据实现集中控制
- 数据一致性和可维护性,以确保数据的安全性和可靠性
- 故障恢复
数据库中的一些概念
数据库(database):
保存有组织的数据的容器(通常是一个文件或一组文件)表(table):
某种特定类型数据的结构化清单,
存储在表中的数据是同一种类型的数据或清单。列(column):
表中的一个字段。所有表都是由一个或多个列组成的。”行(row):
表中的一个记录。主键(primary key):
一列(或一组列),其值能够唯一标识表中每一行。
表中的任何列都可以作为主键,只要它满足以下条件:
任意两行都不具有相同的主键值;
每一行都必须具有一个主键值(主键列不允许NULL值);
主键列中的值不允许修改或更新;
主键值不能重用(如果某行从表中删除,它的主键不能赋给以后的新行)。
也可以一起使用多个列作为主键。在使用多列作为主键时,上述条件必须应用到所有列,所有列值的组合必须是唯一的(但单个列的值可以不唯一)。外键(foreign key KEY):
如果公共关键字在一个表中是主关键字,那么这个公共关键字被称为另一个关系的外键。
一个表中的 FOREIGN KEY 指向另一个表中的 PRIMARY KEY。
FOREIGN KEY 约束用于预防破坏表之间连接的动作。
FOREIGN KEY 约束也能防止非法数据插入外键列,因为它必须是它指向的那个表中的值之一。
SQL
SQL(发音为字母S-Q-L或sequel)是结构化查询语言(Structured Query Language)的缩写。SQL是一种专门用来与数据库沟通的语言。
SQL不是某个特定数据库供应商专有的语言。几乎所有重要的DBMS都支持SQL,所以学习此语言使你几乎能与所有数据库打交道。
许多DBMS厂商通过增加语句或指令,对SQL进行了扩展。这种扩展的目的是提供执行特定操作的额外功能或简化方法。虽然这种扩展很有用,但一般都是针对个别DBMS的,很少有两个以上的供应商支持这种扩展。
标准SQL由ANSI标准委员会管理,从而称为ANSI SQL。所有主要的DBMS,即使有自己的扩展,也都支持ANSI SQL。
与大多数其他计算机语言一样,SQL也可以用函数来处理数据。函数一般是在数据上执行的,为数据的转换和处理提供了方便。
现在,你面临是否应该使用函数的选择。决定权在你,使用或是不使用也没有对错之分。如果你决定使用函数,应该保证做好代码注释,以便以后你(或其他人)能确切地知道所编写的SQL代码的含义。
我们经常需要汇总数据而不用把它们实际检索出来,为此SQL提供了专门的函数。使用这些函数,SQL查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有:
确定表中行数(或者满足某个条件或包含某个特定值的行数);
获得表中某些行的和;
找出表列(或所有行或某些特定的行)的最大值、最小值、平均值。
ORM
全称是:Object Relational Mapping(对象关系映射),其主要作用是在编程中,把面向对象的概念跟数据库中表的概念对应起来。举例来说就是,我定义一个对象,那就对应着一张表,这个对象的实例,就对应着表中的一条记录。这样,我们在具体的操作业务对象的时候,就不需要再去和复杂的SQL语句打交道,只需简单的操作对象的属性和方法。
数据库交互变得简单易行,并且完全不用考虑该死的SQL语句。快速开发,由此而来。
各个数据库比较
mssql : 是微软的 sql server ,只能能运行在windows平台,体积比较庞大,占用许多系统资源,但使用很方便,支持命令和图形化管理,主要结合asp语言开发;mssql是要钱的部门级数据库。
mysql : 是个开源的数据库server,可运行在多种平台,如windows,unix/linux;
他的体积很小是专为WEB 数据库设计的,特点是响应速度特别快,主要面向中小企业,对于海量数据库就显得力不从心了,它是真正的多用户多任务的数据库系统,他占用系统资源很少但功能很强大,可以作为大性数据库系统使用,最主要是其标准版是免费的。yahoo用的就是 mysql: 主要结合php语言开发。MySQL支持基本上是依靠网络和社区。
PostgreSQL:号称“世界上最先进的开源数据库“,可以运行在多种平台下,是tb级数据库,而且性能也很好。
oracle : 1.能在所有主流平台上运行(包括 windows)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持。
2.获得最高认证级别的ISO标准安全认证
3.性能最高, 保持开放平台下的TPC-D和TPC-C的世界记录。
4.多层次网络计算,支持多种工业标准,可以用ODBC,JDBC,OCI等网络客户连接
5.较复杂,同时提供GUI和命令行,在windowsNT和unix下操作相同
6.长时间的开发经验,完全向下兼容。得到广泛的应用。完全没有风险
db2 : 1. 能在所有主流平台上运行(包括windows)。最适于海量数据。DB2在企业级的应用最为广泛,在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器,而国内到97年约占5%。
2. 具有很好的并行性。DB2把数据库管理扩充到了并行的、多节点的环境。数据库分区是数据库的一部分,包含自己的数据、索引、配置文件、和事务日志。数据库分区有时被称为节点或数据库节点
3. 性能最高, 保持开放平台下的TPC-D和TPC-C的世界记录。
4. 性能较高适用于数据仓库和在线事物处理。
5. 跨平台,多层结构,支持ODBC,JDBC等客户
6. 操作简单,同时提供GUI和命令行,在windowsNT和unix下操作相同
7. 在巨型企业得到广泛的应用,向下兼容性好。风险小