聊聊UUID

格式

UUID(universally unique identifier) 长度是128 bit,也就是由32个16进制数值组成。其中 M 表示 version,N 表示 Variants
xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx。例如:5aadc328-8d5e-11ec-8a00-acde48001122

版本

  • Version 1 (date-time and MAC address)
  • Version 2 (date-time and MAC address, DCE security version)
  • Versions 3 and 5 (namespace name-based)
  • Version 4 (random)

Version 1 (date-time and MAC address)

version1 的 UUID 是基于时间戳和 Mac 地址的。先用 ifconfig -v en9查看一下 Mac地址为:acde48001122

en9: flags=8863<UP,BROADCAST,SMART,RUNNING,SIMPLEX,MULTICAST> mtu 1500 index 4
    eflags=21000080<TXSTART,ECN_ENABLE,DIRECTLINK>
    ether ac:de:48:00:11:22
    inet6 fe80::aede:48ff:fe00:1122%en9 prefixlen 64 scopeid 0x4
    nd6 options=201<PERFORMNUD,DAD>
    media: autoselect (100baseTX <full-duplex>)
    status: active
    type: Ethernet
    link quality: 100 (good)
    state availability: 0 (true)
    scheduler: FQ_CODEL
    link rate: 100.00 Mbps
    qosmarking enabled: no mode: none

用 Python 生成的 UUID

>>> import uuid;
>>> uuid.uuid1();
UUID('5aadc328-8d5e-11ec-8a00-acde48001122')

Java
在 JDK 的工具包中,默认只提供了 V3 和 V4 版本的UUID实现。

V3
    public static UUID nameUUIDFromBytes(byte[] name) {
        MessageDigest md;
        try {
            md = MessageDigest.getInstance("MD5");
        } catch (NoSuchAlgorithmException nsae) {
            throw new InternalError("MD5 not supported", nsae);
        }
        byte[] md5Bytes = md.digest(name);
        md5Bytes[6]  &= 0x0f;  /* clear version        */
        md5Bytes[6]  |= 0x30;  /* set to version 3     */
        md5Bytes[8]  &= 0x3f;  /* clear variant        */
        md5Bytes[8]  |= 0x80;  /* set to IETF variant  */
        return new UUID(md5Bytes);
    }
    
V4
    public static UUID randomUUID() {
        SecureRandom ng = Holder.numberGenerator;

        byte[] randomBytes = new byte[16];
        ng.nextBytes(randomBytes);
        randomBytes[6]  &= 0x0f;  /* clear version        */
        randomBytes[6]  |= 0x40;  /* set to version 4     */
        randomBytes[8]  &= 0x3f;  /* clear variant        */
        randomBytes[8]  |= 0x80;  /* set to IETF variant  */
        return new UUID(randomBytes);
    }

我们依赖一个 Java 库来看一下生成的 V1 版本的 UUID,依赖如下:

    <dependency>
        <groupId>com.fasterxml.uuid</groupId>
        <artifactId>java-uuid-generator</artifactId>
        <version>4.0.1</version>
    </dependency>

生成 V1 版本的 UUID。

java-uuid-generator

UUID uuid = Generators.timeBasedGenerator().generate();

991c146f-8f07-11ec-93eb-3d5453c2d114

可以看到 Python 生成的 UUID 和 Java 生成的 UUID 的 Mac 地址并不相同。Python 是真实的 Mac 地址,如果我们去看 Java 的生成代码会发现,它的 Mac 地址是随机生成的。

我们分析一下 5aadc328-8d5e-11ec-8a00-acde48001122的结构

名称 实例 长度(hex digits) 说明
time_low 5aadc328 8
time_mid 8d5e 4
time_hi_and_version 11ec 4 1(version)+1ec(time_hi)
variant and clock_sequence 8a00 4 1 to 3-bit "variant" in the most significant bits, followed by the 13 to 15-bit clock sequence (from wikipedia)

This field is composed of a varying number of bits.
0 - - Reserved for NCS backward compatibility
1 0 - The IETF aka Leach-Salz variant (used by this class)
1 1 0 Reserved, Microsoft backward compatibility
1 1 1 Reserved for future definition.
(from Java comments)

clock sequence 目的是为了避免重复,理解为随机数据就好 |
| node | acde48001122 | 12 | Mac地址 |

根据 time_low、time_mid、time_hi 我们计算一下 UUID 的生成时间。
首先拼接出完成时间 time_hi+time_mid+time_low 即 1ec+8d5e+5aadc328 转换成十进制


image.png

然后在通过 Java 获取一下时间戳,可以发现是一致的。

UUID uuid = UUID.fromString("5aadc328-8d5e-11ec-8a00-acde48001122");
System.out.println(uuid.timestamp());

138641124929422120

看看时间戳是怎么来的,它是从 **1582年10月15日 **开始每隔100纳秒加1。

being the number of 100-nanosecond intervals since midnight 15 October 1582 Coordinated Universal Time (UTC), the date on which the Gregorian calendar was first adopted

最后再来转成当前的时间:

UUID uuid = UUID.fromString("5aadc328-8d5e-11ec-8a00-acde48001122");
Calendar uuidEpoch = Calendar.getInstance(TimeZone.getTimeZone("UTC"));
uuidEpoch.clear();
uuidEpoch.set(1582, 9, 15, 0, 0, 0); // 9 = October
long epochMillis = uuidEpoch.getTime().getTime();
long time = (uuid.timestamp() / 10000L) + epochMillis;
System.out.println(time);

1644819692942
image.png

Version 2 (date-time and MAC address, DCE security version)

UUID Version 2 与 Version 1 类似,Version 2 的 clock_sequence 的低 8 位和 timestamp 的最低 32 位进行了修改,关于 Version 2,RFC 4122 提供的信息也比较少,有的语言也没有实现 UUID Version 2。

Python 2.7.18
    
>>> import uuid;
>>> uuid.uuid1();
UUID('5aadc328-8d5e-11ec-8a00-acde48001122')
>>> >>> uuid.uuid2();
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'module' object has no attribute 'uuid2'

Versions 3 and 5 (namespace name-based)

v3 和 v5 都是基于 namespace 的
v3 = MD5(namespace)

Java v3 实现
    public static UUID nameUUIDFromBytes(byte[] name) {
        MessageDigest md;
        try {
            md = MessageDigest.getInstance("MD5");
        } catch (NoSuchAlgorithmException nsae) {
            throw new InternalError("MD5 not supported", nsae);
        }
        byte[] md5Bytes = md.digest(name);
        md5Bytes[6]  &= 0x0f;  /* clear version        */
        md5Bytes[6]  |= 0x30;  /* set to version 3     */
        md5Bytes[8]  &= 0x3f;  /* clear variant        */
        md5Bytes[8]  |= 0x80;  /* set to IETF variant  */
        return new UUID(md5Bytes);
    }

v5 = SHA1(namespace)

Version 4 (random)

Java v4 实现
    public static UUID randomUUID() {
        SecureRandom ng = Holder.numberGenerator;

        byte[] randomBytes = new byte[16];
        ng.nextBytes(randomBytes);
        randomBytes[6]  &= 0x0f;  /* clear version        */
        randomBytes[6]  |= 0x40;  /* set to version 4     */
        randomBytes[8]  &= 0x3f;  /* clear variant        */
        randomBytes[8]  |= 0x80;  /* set to IETF variant  */
        return new UUID(randomBytes);
    }

Nil UUID

00000000-0000-0000-0000-000000000000

参考

https://en.wikipedia.org/wiki/Universally_unique_identifier
https://www.ietf.org/rfc/rfc4122.txt
https://stackoverflow.com/questions/13070674/get-the-unix-timestamp-from-uuid-version-1
https://python.iitter.com/other/194094.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,869评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,716评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,223评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,047评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,089评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,839评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,516评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,410评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,920评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,052评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,179评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,868评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,522评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,070评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,186评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,487评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,162评论 2 356

推荐阅读更多精彩内容