分布式关系数据库的发展

重点内容:

  • 分布式技术发展内在原因
  • 重要分布式技术模型、经典理论和关键特性
  • NewSQL的定义与解决的问题

1.NewSQL简介

定义:NewSQL是一类关系数据库,它寻求为在线交易处理(OLTP)工作提供NoSQL系统的可扩展性,同时维护传统数据库系统的ACID保证。

NewSQL ≈ RDBMS + NoSQL。
从工程实现的路径上讲,NewSQL = 分布式系统 + SQL + 事务模型,也就是原生分布式关系数据库,这也是NewSQL代名词。

2.分布式技术模型的发展

分布式系统是数据爆发增长的刚需。
如果用户系统需承载的计算量的增长速度大于摩尔定律的预测,集中式系统将无法承载所需的计算量。
而且更加经济,通过相对廉价机器的组合,获得超过cpu发展的速度,以及更好的弹性。

分布式系统定义:分布式系统是一种其组件位于不同的联网计算机上的系统,然后通过互相传递消息来进行通信和协调。为了达到共同的自标,这些组件会相互作用。

上面的定义可简单理解为:把需要进行大量计算的数据分割,由多台计算机分别进行计算和存储,并将结果统一合并到数据结论。本质上就是进行数据存储、计算的分制。

分布式系统额外成本:相比于集中式,成本来自于分治和冗余的“再协作”过程。

分布式系统的挑战:分治与协作带来了系统复杂度提升,主要挑战是如下几点:

  • 如何最大程度实现分治
  • 如何实现全剧以知县
  • 如何进行故障与部分是失效的容错
  • 如何应对不可靠的网络与网络分区

3.CAP理论

一个分布式系统中:
Consistency 一致性
Availability 可用性
Partition Tolerance 分区容错性
三个特性只能满足两个。
因此所有分布式系统都要在这三项中做平衡和选择。
分布式关系数据库也遵循这个关键特性。

衍生BASE理论:
BASE理论的定位是在CAP中选择AP模型(保证可用性和分区容错性),通过最终一致性弥补一致性缺口
基本可用(Basically Available)、软状态(Soft State)、最终一致性(Eventually Consistent)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容