原文:Time, Clocks, and the Ordering of Events in a Distributed System.(http://lamport.azurewebsites.net/pubs/time-clocks.pdf?utm_source=hacpai.com)
一些基本概念:
1.分布式系统定义:由一系列在空间上分离开但是可以相互通信的进程(distinctprocesses)组成的系统。
(A distributed system consists of a collection of distinct processes which are spatially separated, and which communicate with one another by exchanging messages。)
狭义的分布式系统:比如内网组成的计算机网络。
广义的分布式系统:计算的CPU,内存单元,输入输出设备也可以视为一个分布式系统(相互独立的进程)。如果进程间通信的时间不是短得可以被忽略(和单线程中事件发生的时间对比),我们就应该把系统认为是分布式系统。(从这个意义上来说,很多并发问题和分布式问题也很接近)
2.happens before:
a.分布式系统中无法获得精准的物理时间,所以无法用物理时间来定义顺序。(两个事件在非常接近的时间内独立的发生在不同的系统,我们无法通过观察时间来知道谁先谁后。)
b.系统可以看作是由一系列进程组成,每个进程又可以看作由一个事件(事件可以想成指令集)序列组成。
happens before的定义:
1.如果在同一个进程中事件A先于事件B发生,则A—>B;
2.如果事件A在进程1中发生,然后消息传递到进程2,作为事件B,则A—>B;
3.如果A—>B 并且 B—>C,则A—>C;
如果A和B直接没有happens before关系,那么就说A和B之间是并发的。
注意:这里的定义没有用到物理时钟。可以换一种说法,如果A和B有happens before关系,那么他们之间有某种因果关系,注意这里一个事件(A)发生和传递到另外一个进程(B)是两个不同的事件。happens before关系是客观且唯一的。同时是一个事件的偏序关系(因为有并发存在,并发的事件不存在happens before关系)。
(The relation "---->"on the set of events of a system is the smallest relation satisfying the following three conditions: (1) If A and B are events in the same process, and A comes before B, then A —> B. (2) If A is the sending of a message by one process and B is the receipt of the same message by another process, then A —> B. (3) If A—> B and B—> C then A—>C. Two distinct events a and b are said to be concurrent if a -/-> b and b -/-> a.)
3.逻辑时钟
逻辑时钟是用来衡量事件顺序的一种工具,不是真实的时钟,可以想象成某种编号。
定义:C表示系统的逻辑时钟(集合),Ci表示某个进程i的逻辑时钟,Ci(b)表示逻辑时钟Ci在事件b发生的时候的值,C(a)表示事件a在某个逻辑时钟上的值。
那么逻辑时钟需要满足条件: if a—>b,then C(a) < C(b),但是C(a) < C(b) 不能推导出 a—>b(因为存在并发的事件,会相互矛盾,详见论文)。也就说是后者是前者的必要不充分条件。这个条件也意味着在相同进程中先后发生事件,或者事件传输的过程中,逻辑时钟的值都必须要增加。对于并发的事件,可能有C(a)<C(b)或者C(a)=C(b)或者C(a)>C(b)
使用另外一种表述:1.如果在一个进程i中a比b先发生,那么应该有Ci(a)<Ci(b),2.如果消息a和b分别是线程i发送和线程j接收到的某个事件,那么Ci(a)<Cj(b)。(传递性自然成立)
逻辑时钟的一种实现方式:1.对于相同进程,每次事件发送,逻辑时钟值+1;2.发送事件通讯的时候,带上产生事件的值Ci(a),事件b到达的时候,按照自增的方式,可以得到一个Cj(b)',Cj(b)的最终值就取Math.max(Ci(a)+1,Cj(b)')。
4.事件的全序排列
happens before指定了事件的偏序,通过逻辑时钟我们可以给出一个事件的全序排列,尽管这个全序实现的方式不是唯一的。
定义=>表示一种全序关系,A=>B满足且仅需要满足:(i)Ci(A)<Ci(B) or (ii) Ci(A)=Ci(B) and Pi<Pj。(这里Pi<Pj表示某种提前确定下来的进程全序)。如果A—>B,那么一定有 A=>B。
这种全序关系非常重要,比如我们要实现一个分布式锁,这个锁应该有如下的性质:
1.锁只能同时被一个进程持有
2.获得锁的顺序必须跟锁请求发起的顺序一致。(*而不是接收到请求的顺序)
如果两个事件A和B被先后发起(有偏序关系),锁也应该先由事件A持有,再由事件B持有。仅靠中心节点无法保证这个性质,因为后发起的B可能会先到达。更复杂的情况是,A和B是不同的进程发起的,但是也可能会存在某种偏序关系。
3.如果获得锁的进程最终都都会释放锁的话,那么每一个 锁请求最终都会请求成功。
使用逻辑时钟,可以设计一种算法来实现这种分布式锁。
(待补充)