Java 实现 Snowflake 算法

本文介绍 Java 实现 Snowflake 算法生成分布式 ID。


目录

  • Snowflake 算法简介
  • 示例
  • 总结

Snowflake 算法简介

Snowflake 算法是 Twitter 开源的分布式 ID 生成算法,将 64 bit 划分为多个不同组成部分,每部分代表不同含义。

  • 第一部分占用 1 bit,即第 1 位,值始终为 0,可看做符号位暂时不用;
  • 第二部分占用 41 bit,即第 2 至 42 位,代表毫秒数,2 ^ 41 = 2199023255552,2199023255552 / (1000 * 3600 * 24 * 365) > 69.73,因此 Snowflake 算法可用时间年限大约是 69 年;
  • 第三部分占用 10 bit,即第 43 至 52 位,代表机器数,2 ^ 10 = 1024,所以总共允许有 1024 台机器参与生成分布式 ID。如果存在数据中心(Data Center),则可以将这 10 bit 进一步划分,如前 5 bit 代表数据中心,后 5 bit 代表机器,则允许 32 个数据中心且每个数据中心 32 台机器参与生成分布式 ID;
  • 第四部分占用 12 bit,即第 53 至 64 位,属于自增序列,2 ^ 12 = 4096,因此每毫秒一台机器上可生成 4096 个有序且不重复的 ID。

Snowflake 算法生成的分布式 ID 并非绝对唯一,但已满足绝大多数应用场景需求。


示例

package tutorial.java.util;

import java.rmi.UnexpectedException;
import java.util.concurrent.atomic.AtomicLong;

public class SnowflakeDistributedId {

    /**
     * Snowflake算法中第三部分长度,即数据中心和工作机器ID总共占位长度
     */
    private static final long DATA_CENTER_AND_WORKER_ID_BITS = 10;

    /**
     * Snowflake算法中第四部分长度,即自增序列占位长度
     */
    private static final long AUTO_INCREMENT_SEQUENCE_BITS = 12;

    /**
     * 自增序列最大值
     */
    private static final long MAX_SEQUENCE = 4095;

    /**
     * 开始时间戳
     */
    private final long epoch;

    /**
     * 数据中心ID
     */
    private final long dataCenterId;

    /**
     * 机器ID占位长度
     */
    private final long workerIdBits;

    /**
     * 机器ID
     */
    private final long workerId;

    /**
     * 保存上一次生成ID的时间戳
     */
    private long lastTimestamp;

    /**
     * 分布式ID自增序列
     */
    private AtomicLong autoIncrementSequence;

    /**
     * @param dataCenterIdBits 数据中心ID占位长度
     * @param dataCenterId     数据中心ID
     * @param workerId         工作机器ID
     */
    public SnowflakeDistributedId(long epoch, long dataCenterIdBits, long dataCenterId, long workerId) {
        this.epoch = epoch;
        this.dataCenterId = validateDataCenterId(dataCenterIdBits, dataCenterId);
        workerIdBits = DATA_CENTER_AND_WORKER_ID_BITS - dataCenterIdBits;
        this.workerId = validateWorkerId(workerId);
        this.lastTimestamp = -1L;
        this.autoIncrementSequence = new AtomicLong(0);
    }

    /**
     * 初始化数据中心ID
     *
     * @param dataCenterIdBits 数据中心ID占位长度
     * @param dataCenterId     数据中心ID
     * @return 校验通过的数据中心ID
     */
    private long validateDataCenterId(long dataCenterIdBits, long dataCenterId) {
        if (dataCenterIdBits < 0 || dataCenterIdBits >= DATA_CENTER_AND_WORKER_ID_BITS) {
            throw new IllegalArgumentException("Data center ID bits must be in [0, 10)!");
        }
        if (dataCenterIdBits > 0) {
            // 支持的最大数据中心 ID
            long maxDataCenterId = ~(-1 << dataCenterIdBits);
            if (dataCenterId < 0 || dataCenterId > maxDataCenterId) {
                throw new IllegalArgumentException("Data center ID must be in [0, " + maxDataCenterId + "]!");
            }
            return dataCenterId;
        }
        return -1;
    }

    /**
     * 初始化工作机器ID
     *
     * @param workerId 工作机器ID
     * @return 校验通过的工作机器ID
     */
    private long validateWorkerId(long workerId) {
        // 支持的最大机器ID
        long maxWorkerId = ~(-1 << this.workerIdBits);
        if (workerId < 0 || workerId > maxWorkerId) {
            throw new IllegalArgumentException("Worker ID must be in [0, " + maxWorkerId + "]!");
        }
        return workerId;
    }

    /**
     * 生成分布式ID
     *
     * @return long类型ID
     * @throws UnexpectedException 如果系统时间回退则抛出此异常
     */
    public long generate() throws UnexpectedException {
        long currentTimestamp = System.currentTimeMillis();
        // 如果当前时间小于上一次ID生成时间,说明系统时间回退
        if (currentTimestamp < lastTimestamp) {
            throw new UnexpectedException("System clock moved backward, refused to generate ID!");
        }
        long currentSequence;
        if (currentTimestamp == lastTimestamp) {
            // 如果当前时间等于上一次ID生成时间,获取自增序列值后加1
            currentSequence = autoIncrementSequence.getAndIncrement();
            // 如果获取的自增序列值大于允许的最大值
            if (currentSequence > MAX_SEQUENCE) {
                // 等待到下一毫秒
                currentTimestamp = block(currentTimestamp);
                // 更新时间戳
                lastTimestamp = currentTimestamp;
                // 重新获取自增序列值
                currentSequence = resetAutoIncrementSequence();
            }
        } else {
            // 如果当前时间大于上一次ID生成时间,重置自增序列并获取自增序列值后加1
            currentSequence = resetAutoIncrementSequence();
            // 更新时间戳
            lastTimestamp = currentTimestamp;
        }
        // 时间戳左移
        long id = (currentTimestamp - epoch) << (DATA_CENTER_AND_WORKER_ID_BITS + AUTO_INCREMENT_SEQUENCE_BITS);
        if (dataCenterId != -1) {
            // 数据中心ID左移
            id = id | (this.dataCenterId << (workerIdBits + AUTO_INCREMENT_SEQUENCE_BITS));
        }
        return id | (this.workerId << AUTO_INCREMENT_SEQUENCE_BITS) | currentSequence;
    }

    /**
     * 重置自增序列
     *
     * @return 自增序列值
     */
    private synchronized long resetAutoIncrementSequence() {
        autoIncrementSequence = new AtomicLong(0);
        return autoIncrementSequence.getAndIncrement();
    }

    /**
     * 阻塞至下一毫秒
     *
     * @param timestamp 当前时间戳
     * @return 下一毫秒时间戳
     */
    private long block(long timestamp) {
        long currentTimestamp = System.currentTimeMillis();
        while (currentTimestamp <= timestamp) {
            currentTimestamp = System.currentTimeMillis();
        }
        return currentTimestamp;
    }
}

单元测试

import org.junit.Assert;
import org.junit.Test;

import java.rmi.UnexpectedException;
import java.time.Instant;
import java.util.HashSet;
import java.util.Set;

public class SnowflakeDistributedIdTest {

    @Test
    public void test() {
        SnowflakeDistributedId id = new SnowflakeDistributedId(Instant.now().toEpochMilli(),
                5, 1, 8);
        Set<Long> ids = new HashSet<>();
        int iteratorTimes = 100000;
        Runnable runnable = () -> {
            for (int i = 0; i < iteratorTimes; i++) {
                try {
                    ids.add(id.generate());
                } catch (UnexpectedException e) {
                    Assert.fail();
                }
            }
        };
        Set<Thread> threads = new HashSet<>();
        int threadCount = 10;
        for (int i = 0; i < threadCount; i++) {
            threads.add(new Thread(runnable));
        }
        threads.forEach(thread -> {
            thread.start();
            try {
                thread.join();
            } catch (InterruptedException e) {
                Assert.fail();
            }
        });
        Assert.assertEquals(iteratorTimes * threadCount, ids.stream().distinct().count());
    }
}

单元测试说明:共启动 10 个线程,每个线程循环 100000 次执行生成 ID 操作,生成的 ID 全部放入 SET 数据结构中,执行过程抛出任何异常都会导致单元测试失败,最后检查 SET 中元素数量是否等于 10 * 100000,测试结果略。


总结

  1. Java 中 long 类型长度为 64 bit,因此 Java 实现 Snowflake 算法生成的 ID 即保存为 long 类型。
  2. 除 Snowflake 算法外,常见的分布式 ID 生成方案还包括:
    • UUID
    • 数据库生成
    • Redis 生成
    • 百度 UidGenerator
    • 美团 Leaf
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,185评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,652评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,524评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,339评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,387评论 6 391
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,287评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,130评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,985评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,420评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,617评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,779评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,477评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,088评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,716评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,857评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,876评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,700评论 2 354