snowflake升级版全局id生成

1. 背景

分布式系统或者微服务架构基本都采用了分库分表的设计,全局唯一id生成的需求变得很迫切。
传统的单体应用,使用单库,数据库中自增id可以很方便实现。分库之后,首先需要分库键,分库键必然不能重复,所以传统的做法并不能满足需求。概括下来,那业务系统对ID号的要求有哪些呢?

1.全局唯一性:不能出现重复的ID号,既然是唯一标识,这是最基本的要求。
2.趋势递增:在MySQL InnoDB引擎中使用的是聚集索引,由于多数RDBMS使用B-tree的数据结构来存储索引数据,在主键的选择上面我们应该尽量使用有序的主键保证写入性能。
3.单调递增:保证下一个ID一定大于上一个ID,例如事务版本号、IM增量消息、排序等特殊需求。
4.信息安全:如果ID是连续的,恶意用户的扒取工作就非常容易做了,直接按照顺序下载指定URL即可;如果是订单号就更危险了,竞对可以直接知道我们一天的单量。所以在一些应用场景下,会需要ID无规则、不规则。

其中第3和第4点是互斥的。除了功能性需求,还有性能和可靠性的需求:

  • 平均延迟和TP999延迟都要尽可能低;
  • 可用性5个9;
  • 高QPS。

2. 进阶历程

自从项目从单体应用拆分成微服务架构后,对全局id部分做了些摸索。

2.1 uuid

刚开始拆分业务,id主键都是使用uuid字符串。
UUID(Universally Unique Identifier)的标准型式包含32个16进制数字,以连字号分为五段,形式为8-4-4-4-12的36个字符。类似这样的字符串:dc5adf0a-d531-11e5-95aa-3c15c2d22392。128位,根本不用担心不够用。生成的方法也很简单:

UUID userId = UUID.randomUUID();

uuid全球唯一,本地生成,没有网络消耗,产生的性能绝对可以满足。
其缺点也是显而易见的,比较占地方,和INT类型相比,存储一个UUID要花费更多的空间。
使用UUID后,URL显得冗长,不够友好。ID作为主键时在特定的环境会存在一些问题,比如做DB主键的场景下,UUID就非常不适用:

  • MySQL官方有明确的建议主键要尽量越短越好,36个字符长度的UUID不符合要求。
  • 对MySQL索引不利:如果作为数据库主键,在InnoDB引擎下,UUID的无序性可能会引起数据位置频繁变动,严重影响性能。

2.2 数据库生成

以MySQL举例,利用给字段设置auto_increment_incrementauto_increment_offset来保证ID自增,每次业务使用下列SQL读写MySQL得到ID号。
参考了Leaf的实现思想:

  • id server每次批量从数据库取号段,本地缓存这个号段,并且设置阈值,当达到0.8(已用与号段容量的比值),自动去获取一个新的号段,更新本地缓存的号段。
  • id client,即具体的调用服务实例,在本地也做一个缓存,实现和id server的缓存差不多,这样做的目的是为了减轻id服务端的压力,同时减少了rpc调用的网络消耗。

以上方案,其缺点是:

  1. 号段存在浪费,无论哪个客户端还是服务端重启都会浪费号段。
  2. 号段是直接自增,不够随机,对外暴露信息过多。
  3. DB宕机会造成整个系统不可用。虽然在DB宕机之后,利用缓存还能进行短暂供号,但是数据库的依赖还是很重。Leaf采用的一般做法是高可用容灾:

采用一主两从的方式,同时分机房部署,Master和Slave之间采用半同步方式同步数据。同时使用DBProxy做主从切换。当然这种方案在一些情况会退化成异步模式,甚至在非常极端情况下仍然会造成数据不一致的情况,但是出现的概率非常小。

主从
主从

3. snowflake方案

3.1 介绍

考虑到上述方案的缺陷,笔者调查了其他的生成方案,snowflake就是其中一种方案。
趋势递增和不够随机的问题,在snowflake完全可以解决,Snowflake ID有64bits长,由以下三部分组成:

snowflake
snowflake

  1. 第一位为0,不用。

  2. timestamp—41bits,精确到ms,那就意味着其可以表示长达(2^41-1)/(1000360024*365)=139.5年,另外使用者可以自己定义一个开始纪元(epoch),然后用(当前时间-开始纪元)算出time,这表示在time这个部分在140年的时间里是不会重复的,官方文档在这里写成了41bits,应该是写错了。另外,这里用time还有一个很重要的原因,就是可以直接更具time进行排序,对于twitter这种更新频繁的应用,时间排序就显得尤为重要了。

  3. machine id—10bits,该部分其实由datacenterId和workerId两部分组成,这两部分是在配置文件中指明的。

    • datacenterId,方便搭建多个生成uid的service,并保证uid不重复,比如在datacenter0将机器0,1,2组成了一个生成uid的service,而datacenter1此时也需要一个生成uid的service,从本中心获取uid显然是最快最方便的,那么它可以在自己中心搭建,只要保证datacenterId唯一。如果没有datacenterId,即用10bits,那么在搭建一个新的service前必须知道目前已经在用的id,否则不能保证生成的id唯一,比如搭建的两个uid service中都有machine id为100的机器,如果其server时间相同,那么产生相同id的情况不可避免。
    • workerId是实际server机器的代号,最大到32,同一个datacenter下的workerId是不能重复的。它会被注册到consul上,确保workerId未被其他机器占用,并将host:port值存入,注册成功后就可以对外提供服务了。
  4. sequence id —12bits,该id可以表示4096个数字,它是在time相同的情况下,递增该值直到为0,即一个循环结束,此时便只能等到下一个ms到来,一般情况下4096/ms的请求是不太可能出现的,所以足够使用了。

3.2 实现思路

snowflake方案,id服务端生成,不依赖DB,既能保证性能,且生成的id足够随机。每一毫秒,一台worker可以生成4096个id,如果超过,会阻塞到下一毫秒生成。
对于那些并发量很大的系统来说,显然是不够的, 那么这个时候就是通过datacenterId和workerId来做区分,这两个ID,分别是5bit,共10bit,最大值是1024(0-1023)个, 在这种情况下,snowflake一毫秒理论上最大能够生成的ID数量是约42W个,这是一个非常大的基数了,理论上能够满足绝大多数系统的并发量。

该方案依赖于系统时钟,需要考虑时钟回拨的问题。本地缓存上一次请求的lastTimestamp,一个线程过来获取id时,首先校验当前时间是否小于上一次ID生成的时间戳。如果小于说明系统时钟被修改过,回退在上一次ID生成时间之前应当抛出异常!如此可以解决运行中,系统时钟被修改的问题。

另一种情况是,server服务启动时,系统的时间被回拨(虽然比较极端,还是列在考虑中),这样有可能与之前生成的id冲突,全局不唯一。这边解决方法是利用项目的服务发现与注册组件consul,在consul集群存储最新的lastTimestamp,key为对应的machine-id。consul的一致性基于raft算法,并利用Gossip协议:

Consul uses a gossip protocol to manage membership and broadcast messages to the cluster. All of this is provided through the use of the Serf library.

具体的协议算法,可以参考Gossip
每次server实例启动时,实例化id生成bean的时候,会首先校验当前时间与consul集群中该worker对应的lastTimestamp大小,如果当前时间偏小,则抛出异常,服务启动失败并报警。

笔者项目暂时未分data center,所以machine-id部分都是以服务实例的workid代替。workid可以从配置中心获取,也可以本地配置。请求id生成流程图如下:

flow
flow

服务实例启动的流程图见上文,此处不画出了。这边需要强调的是,服务注册与发现组件consul。部署时每个服务实例都会注册到一个consul agent(一般是本机),consul agent连接到consul集群,通过gossip协议进行广播信息,所以如果连接的consul agent进程不幸挂掉(大多为系统宕机),在进程重启后,还是能迅速获取到集群中存储的该workid的lastTimestamp,针对该workid,如果系统时间回拨小于lastTimestamp,Generator启动时会报警。而对于大于lastTimestamp的情况,可能系统时钟还是相对回拨,我们姑且可以认为对全局id没有影响。

实例化时,进行校验:

    public IdServiceImpl(long workerId, ConsulClient consulClient) {
        if (workerId > idMeta.MAX_ID || workerId < 0) {
            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", idMeta.MAX_ID));
        }
        this.workerId = workerId;
        this.consulClient = consulClient;
        validateStoredTimestamp();
        log.info("worker starting. timestamp left shift {},  worker id bits {}, sequence bits {}, workerid {}", idMeta.TIMESTAMP_LEFT_SHIFT_BITS, idMeta.ID_BITS, idMeta.SEQUENCE_BITS, workerId);
    }

校验函数:

    /**
     * checks for timestamp by workerId when server starts.
     * if server starts for the first time, just let it go and log warns.
     * if current timestamp is smaller than the value stored in consul server, throw exception.
     */
    private void validateStoredTimestamp() {
        long current = timeGen();
        Response<GetValue> keyValueResponse = consulClient.getKVValue(String.valueOf(workerId));
        if (keyValueResponse.getValue() != null) {
            lastTimestamp = Long.parseLong(keyValueResponse.getValue().getDecodedValue());
            validateTimestamp(current, lastTimestamp, Periods.START);
        } else {
            log.warn(String.format("clock in consul is null.  Generator works as for the 1st time."));
        }
    }

validateTimestamp:

/**
     * 如果当前时间戳小于上一次ID生成的时间戳,说明系统时钟被修改过,回退在上一次ID生成时间之前应当抛出异常!!!
     *
     * @param lastTimestamp 上一次ID生成的时间戳
     * @param timestamp     当前时间戳
     */
    private void validateTimestamp(long timestamp, long lastTimestamp, Periods period) {
        if (timestamp < lastTimestamp) {
            log.error(String.format("clock is moving backwards.  Rejecting requests until %d.", lastTimestamp));
            throw new IllegalStateException(String.format("Clock moved backwards in %s.  Refusing to generate id for %d milliseconds", period, lastTimestamp - timestamp));
        }
    }

获取id方法:

   /**
     * 生成ID(线程安全)
     *
     * @return id
     */
    public synchronized long genId() {
        long timestamp = timeGen();

        //如果当前时间小于上一次ID生成的时间戳,说明系统时钟被修改过,回退在上一次ID生成时间之前应当抛出异常!!!
        validateTimestamp(timestamp, lastTimestamp, Periods.RUNNING);

        //如果是同一时间生成的,则进行毫秒内sequence生成
        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & IdMeta.SEQUENCE_MASK;
            //溢出处理
            if (sequence == 0) {//阻塞到下一毫秒,获得新时间戳
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {//时间戳改变,毫秒内sequence重置
            sequence = 0L;
        }
        //上次生成ID时间截
        lastTimestamp = timestamp;
        consulClient.setKVValue(String.valueOf(workerId), String.valueOf(lastTimestamp));
        //移位并通过或运算组成64位ID
        return ((timestamp - idMeta.START_TIME) << idMeta.TIMESTAMP_LEFT_SHIFT_BITS) | (workerId << idMeta.ID_SHIFT_BITS) | sequence;
    }

4. 总结

这篇文章和大家分享了笔者项目中全局id生成服务的演进过程。当前的方案可以满足笔者当前项目的需求,至于分data-center(同一个机房优先调用),需要结合rpc调用进一步做处理,所以这块后续可以继续完善。欢迎大家提出建议。


参考:

  1. www.consul.io
  2. leaf
  3. Twitter的分布式自增ID算法snowflake (Java版)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,639评论 18 139
  • 本文主要介绍在一个分布式系统中, 怎么样生成全局唯一的 ID 一, 问题描述 在分布式系统存在多个 Shard 的...
    hanayona阅读 1,992评论 0 5
  • 本文主要介绍在一个分布式系统中, 如何去生成全局唯一的 ID。 前言 单纯的生成全局ID并不是什么难题,生成全局的...
    FX_SKY阅读 2,321评论 0 6
  • 转载:细聊分布式ID生成方法 一、需求缘起 几乎所有的业务系统,都有生成一个记录标识的需求,例如: (1)消息标识...
    meng_philip123阅读 2,562评论 0 17
  • 我把我的草帽留在了德国 我把我的草帽留在了德国。 2017年7月27日,我们一行人前往德国开始为期20天的欧洲游。...
    猗璘馆阅读 160评论 0 0