雪花算法详解

原创

已于 2023-06-15 08:59:38 修改 · 1.9k 阅读

于 2023-03-21 10:40:42 首次发布

该文章已同步收录到我的博客网站，欢迎浏览我的博客网站，xhang’s blog

1.SnowFlake 雪花算法简介

SnowFlake 中文意思为雪花，故称为雪花算法。最早是 Twitter 公司在其内部用于分布式环境下生成唯一 ID。

雪花算法将 64 位二进制位划分为五个部分，分别如下：

符号位：始终为 0，占用 1 位。
时间戳：精确到毫秒级，占用 41 位。
机器 ID：机器 ID 可以划分为两部分，占用 10 位。其中 5 位是数据中心 ID，另外 5 位是机器 ID。
序列号：序列号可以精确控制单位时间内最大生成的 ID 数量，占用 12 位。
总共 64 位，除去符号位后剩下 63 位，刚好是一个 Java long 类型的取值范围。

2.雪花算法各个部分分析

符号位

因为二进制里第一个bit如果为1，则表示为负数。但是雪花算法生成的long类的数字都是整数，所以第一个bit统一都是0。

时间戳

41bit可以表示的数字多达2^41 - 1，也就是可以标识2 ^ 41 - 1个毫秒值，换算成年就是69年的时间。

年 = (1L << 41) / (1000L * 60 * 60 * 24 *365) = 69

工作机器ID

工作机器ID有10bit位，就表示这个服务最多部署在2^10台机器上，也就是1024台机器。但是10 bit里5个bit 代表机房id, 5个bit代表机器id。意思就是最多代表2^5个机房(32 个机房)，每个机房里可以代表2^5个机器(32 台机器)，也可以根据自己公司的实际情况确定。

序列号

12 bit可以代表的最大正整数是2^12- 1 = 4096,也就是说可以用这个12 bit代表的数字来区分同-一个毫秒内的
4096个不同的id。

3.雪花算法源码

/**
 * Twitter的SnowFlake算法,使用SnowFlake算法生成一个整数，然后转化为62进制变成一个短地址URL
 *
 * https://github.com/beyondfengyu/SnowFlake
 *
 * Snowflake生成的是Long类型的ID，一个Long类型占8个字节，每个字节占8比特，也就是说一个Long类型占64个比特。
 * Snowflake ID组成结构：正数位（占1比特）+ 时间戳（占41比特）+ 机器ID（占5比特）+ 数据中心（占5比特）+ 自增值（占12比特），总共64比特组成的一个Long类型。
 * ● 第一个bit位（1bit）：Java中long的最高位是符号位代表正负，正数是0，负数是1，一般生成ID都为正数，所以默认为0。
 * ● 时间戳部分（41bit）：毫秒级的时间，不建议存当前时间戳，而是用（当前时间戳 - 固定开始时间戳）的差值，可以使产生的ID从更小的值开始；41位的时间戳可以使用69年，(1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69年
 * ● 工作机器id（10bit）：也被叫做workId，这个可以灵活配置，机房或者机器号组合都可以。
 * ● 序列号部分（12bit），自增值支持同一毫秒内同一个节点可以生成4096个ID
 * 根据这个算法的逻辑，只需要将这个算法用Java语言实现出来，封装为一个工具方法，那么各个业务应用可以直接使用该工具方法来获取分布式ID，只需保证每个业务应用有自己的工作机器id即可，而不需要单独去搭建一个获取分布式ID的应用。
 */
public class SnowFlakeUtil {
   
   

    /**
     * 起始的时间戳
     */
    private final static long START_TIMESTAMP = 1480166465631L;

    /**
     * 每一部分占用的位数
     */
    private final static long SEQUENCE_BIT = 12;   //序列号占用的位数
    private final static long MACHINE_BIT = 5;     //机器标识占用的位数
    private final static long DATA_CENTER_BIT