总结:
这里讲的是NoSQL数据库的基本原理,重要的特性和类型。NoSQL数据库并没有一种特定的标准,因为目前来说还是比较新颖的形式,而且每个厂商都有每个厂商的做法,不同类型的数据库也有不同数据库的做法。它更像是传统数据库的一种补充,暂时还没办法完全替代。在企业里面一般是混合使用,现在用的比较多的是mongoDB。
5.1 NoSQL简介
Not only SQL
NoSQL数据库具有以下几个特点:
(1)灵活的可扩展性
(2)灵活的数据模型
(3)与云计算紧密融合
5.2 NoSQL兴起的原因
1、关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面:
(1)无法满足海量数据的管理需求
(2)无法满足数据高并发的需求
(3)无法满足高可扩展性和高可用性的需求
- MySQL集群是否可以完全解决问题?
不能解决问题,它很复杂,而且很多操作需要手工去做,无论是复制扩容还是动态数据迁移都会很麻烦。
3、“One size fits all”模式很难适用于截然不同的业务场景
•Hadoop就是针对数据分析
•MongoDB、Redis等是针对在线业务,两者都抛弃了关系模型
- 关系数据库的关键特性包括完善的事务机制和高效的查询机制。但是,关系数据库引以为傲的两个关键特性,到了Web2.0时代却成了鸡肋,主要表现在以下几个方面:
(1)Web2.0网站系统通常不要求严格的数据库事务
(2)Web2.0并不要求严格的读写实时性
(3)Web2.0通常不包含大量复杂的SQL查询(去结构化,存储空间换取更好的查询性能)
5.3 NoSQL与关系数据库的比较
总结
(1)关系数据库 优势:以完善的关系代数理论作为基础,有严格的标准,支持事务ACID四性,借助索引机制可以实现高效的查询,技术成熟,有专业公司的技术支持 劣势:可扩展性较差,无法较好支持海量数据存储,数据模型过于死板、无法较好支持Web2.0应用,事务机制影响了系统的整体性能等
(2)NoSQL数据库 优势:可以支持超大规模数据存储,灵活的数据模型可以很好地支持Web2.0应用,具有强大的横向扩展能力等 劣势:缺乏数学理论基础,复杂查询性能不高,大都不能实现事务强一致性,很难实现数据完整性,技术尚不成熟,缺乏专业团队的技术支持,维护较困难等
总结
关系数据库和NoSQL数据库各有优缺点,彼此无法取代
•关系数据库应用场景:电信、银行等领域的关键业务系统,需要保证强事务一致性
•NoSQL数据库应用场景:互联网企业、传统企业的非关键业务(比如数据分析)
5.4 NoSQL的四大类型
键值数据库、列族数据库、文档数据库和图形数据库
5.5 NoSQL的三大基石
- CAP: Consistency、Availability、Tolerance of Network Partition
一个分布式系统不可能同时满足一致性、可用性和分区容忍性这三个需求,最多只能同时满足其中两个
- BASE:Basically Availble, Soft-state, Eventual consistency
5.6 从NoSQL到NewSQL数据库
5.7 文档数据库MongoDB
待做
2018.6.17
课程来自中国大学mooc,厦门大学 林子雨老师的 《大数据技术原理与应用》