分布式关系型数据库的粗浅认知

市面上分布式关系型数据库目前越来越多,大家的主要目标就是解决关系型数据库扩展性问题,但是流派主要分3波,分库分表加mysql存储,Spanner路线,Aurora路线。

走分库分表加mysql存储路线的,开源产品中有cobar,mycat,sharding-jdbc等,闭源能使用到的产品包括阿里云上的DRDS(TDDL)、腾讯云上的DCDB(TDSQL)等,这条路线最近被另外两条路线抨击比较多,因为站在某些业务场景和规模上(中小场景和规模),分库分表确实对业务要求比较高,存在比较繁重的业务改造,核心问题在于这条路线暴露了拆分条件,需要让用户根据业务特性来判断,一下子把产品做成了一个架构设计,实际上拆分条件就是数据聚簇的依据,类似用单机关系型数据库也会纠结选择哪个唯一字段做主键一样,无非让查询相对二级索引少走一次btree检索,但是分库分表或者分布式数据库领域,维护二级索引一致性无论是强一致还是最终一致都是一个比较痛苦的事情,因为索引和聚簇的数据可能不在一个节点上,这样就跨了一次网络,不确定性大幅度上升(MySQL单机聚簇数据和索引很少不一致,但是主备数据不一致概率大很多,大部分是因为数据同步中断),但是二级索引还是有必要存在的,一些产品也提供了这种能力支撑,但是不能滥用。某种意义上来说,把应用改成使用分库分表的数据库解决方案时,就如同单机MySQL只支持了主键索引(当然不会那么惨,因为每个分片上还是走到了本地索引,只是多走了几个分片,可以用并行策略比较好的解决),这个时候你的应用应该怎么写的问题,不过在核心业务场景,分库分表恰好屏蔽掉了让开发玩得很爽,正式上线压力一大就出故障的问题,并且方案非常成熟,另外MySQL存储是一种非常稳定的存在,以及运维工具、人才储备都是相当充足的,所以你把分布式数据库比作一位姑娘,Spanner路线和Aurora路线的产品就像一个让你浴火焚身的热辣妹子,分库分表加mysql路线就如同一个其貌不扬,但是能够踏踏实实每天把饭菜做好给你吃的居家女孩。

走Spanner路线,开源产品中有最近比较火的TiDB,以及google Colossus团队出来的人打造的CockroachDB,闭源能使用到的就是Google Cloud上的Spanner产品本尊,阿里云上的Oceanbase也走的这条路线,虽然一直挂在阿里云上,但是一直不见客。这条路线实际上和分库分表加MySQL唯一区别就在于事务处理。关系型数据库里面,最核心就是事务,所有的索引、唯一约束、主键约束、外键约束、DDL等都依赖于事务。分布式数据库这个领域,事务核心在于可见性。一致性或者原子性可以通过log实现,但是可见性只有两条路:分布式锁或者分布式MVCC,腾讯的DCDB底下基于MariaDB经过艰难困苦的改造,勉强基于XA实现了分布式事务(腾讯之前放出过来一篇文章,随后马上被删除了),但代价非常巨大,性能不行,而基于原生MySQL,XA压根是一个鸡肋,两个重大问题长期没有解决(半开事务没有挂起能力,主备同步问题),直到最近5.7.X才得到解决,效果未知,另外分布式死锁是这个领域里比较恶心的问题。如果想基于分布式MVCC实现分布式可见性,一个是MySQL并没有暴露或者很难暴露版本,另外如果想要基于MySQL上做一层MVCC,数据实时合并的噩梦让人恐惧,所以这条路线产品的存储必然是一个新的东西,需要时间和场景历练,没个5-6年下不来。

走Aurora路线的,开源据了解应该没有,闭源能够使用到的只有AWS上的Aurora,阿里云上的PolarDB也走这个路线,但是目前还在内测,具体未知,从某种意义上来说,Oracle RAC是这类数据库的祖先,归并到这类也无可厚非,这条路线实际上我个人觉得是从大部分用户诉求去考虑了,就是大部分用户QPS打不满单机数据库,但是数据把磁盘给撑爆了。可能有人想一个数据库机器下挂很多个盘不就解决问题了,但是还是会碰到数据库备份、克隆、DDL因为大数据文件的搬迁导致的延迟和不确定性,所以解决方案就从存储这层下手,分布式用户态文件系统、RDMA等措施改造底层存储,解决数据传输带宽限制、数据读写损耗、数据备份缓慢等问题,但是上层MySQL还是MySQL,全兼容,存储又能做得很大。不过同时因为分布式能力的缺失,事务读写只能单点,只能靠强力的机器堆,满足大部分用户的数据事务读写要求,并且RDMA在容灾层面存在问题,需要靠管控快速切换或者类似paxos解决问题。AWS在国内不给力,不过如果有机会在Aurora上实际跑跑业务可能是真正了解这种架构优缺点的唯一方法,因为我在google上找Aurora的缺点,确实没有找到,要么实在太好了,要么就是用得人还不多。

使用关系型数据库是一个控制欲望的过程,20年前,关系型数据库应对当时的世界可能足够了,你可以用很复杂的关系模型,因为数据量和访问量就那么大,但是现在时代发展了,很多时候我们没有意识到以前实现的关系模型可能并不适用于现在的业务场景,说得难听点,就是糟粕了。这个领域是在不断往前看,也许以前在做分库分表的产品,会推出新存储的强一致分布式数据库,做Aurora类型数据库的加一层共享内存实现事务读写的强一致性,而做spanner路线数据库是难度最大、成熟曲线最高的一种方式,需要时间。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容