【ZStack】3.ZStack的伸缩性秘密武器:无锁架构

在IaaS(Infrastructure as a Service,即基础设施即服务)软件里许多任务要顺序的执行;例如,当一个起动虚拟机的任务正在运行时,一个结束些虚拟机的任务则必有等待之前的开始任务结束才行。另一方面,一些任务以需要并发的同时运行;例如,在同一主机上20个创建虚拟机的任务能同时运行。同步和并行在一个分布式系统中是不好控的并且常常需要一个同步软件。针对这个挑战,ZStack提供了一个基于队列的无锁架构,允许任务很容易的来控制它们的并行级别,从一个同步到N个并行都行。

动机

一个好的IasS软件在任务的同步及并行上需要有精细的控制。大多数情况下,任务之间有依赖关系需要以某一顺序来执行;例如,一个删除卷的任务不能被执行,如果另一个在此卷上做快照备份的任务正在执行中。有时,任务要并发执行来提升性能;例如,在同一台主机上十个创建虚拟机的任务同时执行一点问题也没有。当然,没有正常的控制,并行任务也会损坏系统;例如,1000个同时执行的创建虚拟机的任务虽不会使系统挂掉但至少导致系统有段时间没有响应。这种同步开发问题在多线程环境是很复杂的,在分布式环境就显得更加复杂了。

问题

教科书告诉我们,锁和信号量是同步和并行的答案;在分布式系统中,处理同步和并行的最直接的想法是,使用某种分布式的协调软件,像 Apache ZooKeeper ,或者在 Redis之上构建的类似软件。 分布式协调软件的使用概况,例如, ZooKeeper,像下面这样:

问题是,对于锁或信号量, 线程需要等待其它线程释放它们正在使用的锁或信号量。在ZStack 的伸缩性秘密(第一部分)异步架构(ZStack's Scalability Secrets Part 1: Asynchronous Architectue) 一文中,我们解释了,ZStack是一种异步软件,线程不会因等待其它线程的完成而阻塞;因此,锁和信号量不是可行的选项。同时,我们也关心使用分布式协调软件的复杂性和拓展性,想象一下,一个满载100,000个需要锁的任务的系统,这既不容易,也不易拓展。

同步的vs. 同步化的:在 ZStack 的伸缩性秘密(第一部分)异步架构(ZStack's Scalability Secrets Part 1: Asynchronous Architecture)一文中, 我们讨论了 同步的 vs. 异步的,在本文中,我们将会讨论 同步的 vs. 并行的。“同步的”和“同步化的”有时候是可互换的使用,但是它们是不同的。在我们的场景中,“同步的”是在讨论,关于执行一个任务是否会阻塞线程的问题;“同步化的”是在讨论,关于一个任务是否排它的执行的问题。如果一个任务在完成前,一直占据一个线程的所有时间,这就是一个同步的任务;如果一个任务不能和其它任务在同一时间执行,这就是一个同步化的任务。

无锁架构的基础

使用一致性哈希算法,来保证同一个服务实例能够处理所有到达同一资源的消息,这就是无锁架构的基础。通过这种方法聚集到达某一节点的消息,可以减少从分布式系统到多线程环境的同步,并行化的复杂性(更多细节见ZStack的伸缩性秘密(第二部分):无状态服务)。

工作队列:传统解决方案

注意:在深入了解细节之前,请注意,我们即将要谈论的队列,和在 ZStack 的伸缩性秘密(第二部分)无状态服务(ZStack's Scalability Secrets Part 2: Stateless Services)一文中提到的RabbitMQ消息队列,没有任何关联。消息队列是RabbitMQ的术语;ZStack的队列则是内部数据结构。

在ZStack中的任务是由消息驱动的,聚合消息让相关的任务可以在同样的节点执行,减轻了经典的线程池并发编程的压力。为了避免锁竞争,ZStack使用工作队列替代锁和信号量。同步化的任务可以一个接一个的执行,它们由基于内存的工作队列维护:

注意:工作队列可以同时执行同步化的和并行的任务。如果并行级别为1,那么队列就是同步化的;如果并行级别大于1,那么队列是并行的;如果并行级别为0,那么队列就是无限并行的。

基于内存的同步队列

在Zstack中有两种工作队列;一种是同步队列,任务返回结果才认定为结束(通常使用Java Runnable接口来实现):

thdf.syncSubmit(new SyncTask<Object>() {    

 @Override     

public String getSyncSignature() {       

      return "api.worker";    

 }   


  @Override     

public int getSyncLevel() {       

      return apiWorkerNum;   

  }    


 @Override    

 public String getName() {      

       return "api.worker";    

 }    



@Override     

public Object call() throws Exception {        

 if (msg.getClass() == APIIsReadyToGoMsg.class) {           

      handle((APIIsReadyToGoMsg) msg);        

 } else {        

     try {                

             dispatchMessage((APIMessage) msg);      

       } catch (Throwable t) {               

              bus.logExceptionWithMessageDump(msg, t);           

              bus.replyErrorByMessageType(msg, errf.throwableToInternalError(t));    

         }         }       

  /* When method call() returns, the next task will be proceeded immediately */                   return null;   

  } });

强调: 在同步队列中,工作线程继续读取下个Runnable,只要前一个Runnable.run()方法返回结果,并且直接队列为空了才返回线程池。因为任务在执行时会取得工作线程,队列是同步的.

基于内存的异步队列

另一种是异常工作队列,当它发出一个完成通知才认为结束:

thdf.chainSubmit(new ChainTask(msg) {    

 @Override     

public String getName() {        

     return String.format("start-vm-%s", self.getUuid());    

 }    


 @Override    

 public String getSyncSignature() {        

     return syncThreadName;     

}     


@Override     

public void run(SyncTaskChain chain) {         

    startVm(msg, chain);                

  /* the next task will be proceeded only after startVm() method calls chain.next() */    

 } });

强调: 在异步队列中,ChainTask.run(SyncTaskChain chain) 方法可能在做一些异步 操作后立即返回;例如,发送消息和一个注册的回调函数.在run()方法返回值后,工作线程回到线程池中;但是,之前的任务可能还没完成,没有任务能够被处理,直到之前的任务发出一个通知(如调用SyncTaskChain.next())。因为任务不会阻塞工作线程等待其完成,队列是异步的。

基于数据库的异步队列

基于内存的工作队列简单快速,它满足了在单一管理节点99%的同步和并行的需要; 然而,与创建资源相关的任务,可能需要在不同管理节点之间做同步。一致性哈希环基于资源UUID来工作,如果资源未被创建,它将无法得知哪个节点应该处理这个创建的工作。在大多数情况下,如果要创建的资源不依赖于其它未完成的任务,ZStack会选择,此创建任务的提交者所在的本地节点,来完成这个工作。不幸的是,这些不间断的任务依赖于名为虚拟路由VM的特殊资源; 例如,如果使用同样的L3网络的多个用户VM,由运行于不同管理节点的任务创建而成,同时在L3网络上并无虚拟路由VM,那么创建虚拟路由VM的任务则可能由多个管理节点提交。在这种情况下,由于存在分布式同步的问题,ZStack使用基于数据库的作业队列,这样来自不同管理节点的任务就可以实现全局同步。

数据库作业队列只有异步的形式;也就是说,只有前一个任务发出一个完成通知后,下一个任务才能执行。

注意: 由于任务存储在数据库之中,所以数据库作业队列的速度比较慢;幸运的是,只有创建虚拟路由VM的任务需要它。

限制

虽然基于无锁架构的队列可以处理99.99%的时间同步,但是有一个争用条件从一致的散列算法中产生:一个新加入的节点将分担一部分相邻节点的工作量,这就是一致的散列环的扩张的结果。

在这个例子中,在三个节点加入后,以前的目标定位从节点2转到了节点3;在此期间,如果对于资源的一个旧任务依旧工作在节点2上,但是对于相同资源的任务提交到节点3,这就会造成争用状态。然而,这种状况并不是你想像中的那么坏。首先,冲突任务很少地存在规则的系统中,比如,一个健全的 UI 不允许你阻止一个正在运行的 VM。然后,每一个 ZStack 资源都有状态,一个开始就处于问题状态的任务会出现错误;比如,如果一个 VM 是停止状态,一个附加任务量的任务就会立刻出错。第三,代理--大多数任务的传送地,有额外的附加机制;比如,虚拟路由器代理会同步所有的修改 DHCP 配置文件的请求,即使我们已经有了虚拟路由器在管理节点端的工作队列。最后,提前规划你的操作是持续管理云的关键;操作团队可以在推出云之前快速产生足够的管理节点;如果他们真的需要动态添加一个新的节点,这样做的时候,工作量还是比较小的。

总结

在这篇文章里,展示了建立在基于内存工作队列和基于数据库的无锁结构。没有涉及复杂的分布式协作软件,ZStack 尽可能地在争用条件下的屏蔽任务中配合提升性能。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352

推荐阅读更多精彩内容