从论文 Millions of Tiny Databases, 聊聊 TiDB 的多租户

对于很多用户来说,一直希望 TiDB 能提供多租户的能力,也就是大家只想部署一个 TiDB 集群,然后将所有的租户业务放在这个 TiDB 集群上面运行。但其实我们并没有原生提供多租户的支持。即使在云上面,TiDB cloud 虽然有多租户的支持,但也仍然是一个租户一个独立的 TiDB 集群,这些集群都是通过 Kubernates 来管理的。那么,为啥我们不做呢,我想可能有如下的理由:

  • 不要把鸡蛋放在一个篮子里面,我相信这句话大家都知道,无论 TiDB 有多么健壮,但如果只有一个集群,真出现了问题,很有可能所有业务都会受到影响。
  • 隔离问题,在 TiDB 内部做不同租户的资源隔离其实算非常困难的,无论是对于 CPU,Mem 还有 I/O 的使用,其实都很难做到精细化的控制。很可能一个租户的大的查询请求就影响了其他的租户业务。所以我们更倾向于在外部用现阶段成熟的方案来做资源隔离。
  • 升级问题,因为只有一个集群,所以如果我们给某个租户开发了一个功能,要不要整个集群进行升级?虽然 TiDB 可以不停机升级,但在升级的时候总是会对业务有轻微的影响,我们不得不去考量。
  • 租户功能冲突,譬如某个租户为了更好的性能需要开启某个功能,但这个功能其实另外的租户不需要,那么我们到底要不要开启?

可以看到,单个 TiDB 实现多租户其实并没有我们想象中那么美好。虽然有一些数据库厂商说自己能支持多租户,但我们还是决定先不提供这个功能。刚好,最近看到了一篇 Paper 《Millions of Tiny Databases》,来自于 Amazon 团队,他们也有类似的考量。

在这篇论文里面,Amazon 团队构建了一个叫做 Physalia 的系统,当网络分区等故障出现的时候,Physalia 能尽量减少这些故障对整个系统的影响。它的设计其实挺简单,一个 Physalia 可以认为是一个 Colony,每个 Colony 里面有多个 Cells,每个 Cell 有多个 Clients。Cell 是 Physalia 降低故障半径的主要工具。

这里可以类比 TiDB,我们可以认为 Physalia 是一个 K8s 集群,每一个 Cell 是一个 TiDB 集群,而 Client 则是不同租户。Cell 里面 Clients 越多,那么当这个 Cell 出问题的时候影响的 Clients 就越多,反之则越少。原理其实很简单,下面是 Physalia 实际部署之后的效果,绿线右边就是部署之后,整个系统的错误率:

可以看到,使用 Physalia 之后,错误率减少了很多。这篇 Paper 其实比较清晰易懂,大家可以自己去看看。

上面只是提到了我们对于一些多租户的想法,但如果有用户真的想要 TiDB 提供多租户的功能,开几个脑洞先:

  1. 在 TiDB 这层提供简单的租户 Quota 控制,这个其实在之前的 TiDB hackathon 就有团队做了这个功能,因为 TiDB 每个请求都能知道查了多少 key 这些指标,所以我们可以在 TiDB 做一个简单的 Quota 控制,算一个粗糙版本多租户吧。
  2. 更加方便的多 TiDB 集群管理机制,我们可以在 K8s 上面支持,这个也是现在在云上 TiDB DBaaS 在做的事情。只要有 K8s,on-premise 支持也很容易。其实很多用户不想多套 TiDB 集群,一方面是担心多套 TiDB 的成本,另外就是担心运维复杂,但这些都是后面我们重点解决的问题,所以我相信这个仍然会是我们的演进方向。
  3. 用户可能为了方便,会开始将所有租户的数据放到一个 TiDB 集群,如果发现某个租户需要做更多的隔离了,通过 TiDB 工具快速的将数据迁移到另外一个 TiDB 集群进行管理。不过实话,我觉得如果能方便的运维多 TiDB 集群了,其实也没啥必要做这个了。

上面只是一些脑洞,我也非常欢迎社区的同学能给我们提 Proposal,共同来讨论多租户问题。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352

推荐阅读更多精彩内容