数据库
数据库是一种用于存储数据集合的独立应用程序。每种数据库都会有一个或多个独特的 API,用来创建、访问、管理、搜索或复制数据库中保存的数据。
SQL(Structured Query Language)
现在业界一般采用关系型数据库管理系统(RDBMS)来存储并管理海量数据。之所以称其为关系型数据库,是因为所有数据都存储在不同的表中,表之间的关系是建立在主键或其他键(被称为外键)的基础之上的。
关系型数据库管理系统(RDBMS)具有以下特点:
能够实现一种具有表、列与索引的数据库。
保证不同表的行之间的引用完整性。
能自动更新索引。
能解释 SQL 查询,组合多张表的信息。
SQL数据库的术语定义:
数据库(Database):数据库是带有相关数据的表的集合。
表(Table):表是带有数据的矩阵。数据库中的表就像一种简单的电子表格。
列(Column):每一列(数据元素)都包含着同种类型的数据,比如邮编。
行(Row):行(又被称为元组、项或记录)是一组相关数据,比如有关订阅量的数据。
冗余(Redundancy):存储两次数据,以便使系统更快速。
主键(Primary Key):主键是唯一的。同一张表中不允许出现同样两个键值。一个键值只对应着一行。
外键(Foreign Key):用于连接两张表。
复合键(Compound Key):复合键(又称组合键)是一种由多列组成的键,因为一列并不足以确定唯一性。
索引(Index):它在数据库中的作用就像书后的索引一样。
引用完整性(Referential Integrity):用来确保外键一直指向已存在的一行。
MySQL 数据库
MySQL 是一种快速易用的 RDBMS,很多企业(不分规模大小)都在使用它来构建自己的数据库。MySQL 由一家瑞典公司 MySQL AB 开发、运营并予以支持。它之所以非常流行,原因在于具备以下这些优点:
基于开源许可发布,无需付费即可使用。
自身的功能非常强大,足以匹敌绝大多数功能强大但却价格昂贵的数据库软件。
使用业内所熟悉的标准SQL数据库语言。
可运行于多个操作系统,支持多种语言,包括 PHP、PERL、C、C++ 及 Java 等语言。
非常迅速,即使面对大型数据集也毫无滞涩。
非常适用于 PHP 这种 Web 开发者最喜欢使用的语言。
支持大型数据库,最高可在一个表中容纳 5千多万行。每张表的默认文件大小限制为 4GB,不过如果操作系统支持,你可以将其理论限制增加到 800 万 TB。
可以自定义。开源 GPL 许可保证了程序员可以自由修改 MySQL,以便适应各自特殊的开发环境。
NoSQL
MogonDB(非关系型数据库、文档型数据库)
MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 json 的 bson 格式,因此可以存储比较复杂的数据类型。
MongoDB 是一款跨平台、面向文档的数据库。用它创建的数据库可以实现高性能、高可用性,并且能够轻松扩展。MongoDB 的运行方式主要基于两个概念:集合(collection)与文档(document)。
集合
集合就是一组 MongoDB 文档。它相当于关系型数据库(RDBMS)中的表这种概念。集合位于单独的一个数据库中。集合不能执行模式(schema)。一个集合内的多个文档可以有多个不同的字段。一般来说,集合中的文档都有着相同或相关的目的。
文档
文档就是一组键-值对。文档有着动态的模式,这意味着同一集合内的文档不需要具有同样的字段或结构。
下表展示了关系型数据库与 MongoDB 在术语上的对比:
MySQL、MongoDB对比:
Mysql在性能不错的情况下,有着开源优势。Mysql的事务性与高性能是我们主要考虑的MySQL进行海量存储的时候效率会显著变慢;
关系数据库的基本存储单元是表。而一张表则是有行有列的数据集合,而列的定义有严格的类型。所以关系数据库是一个严格定义的数据模型,每张表里的每条记录都是一个样的;
MongoDB 里面每个集合的每个文档并不要求数据严格一致,而是可能千差万别;
MongoDB 还有一个特色,它的查询使用的不是 SQL,而是程序语言和 API;
MongoDB以BSON(二进制)、JSON进行存储,对海量数据存储有着明显的优势
两者操作命令对比:
特别要注意,mongodb插入多个字段语法:
> db.user.insert({id:1,name:'steve',sex:'male'}) 正确
> db.user.insert({id:2},{name:'bear'},{sex:'female'}) 错误