Springboot分布式Snowflake ID生成工具uid-generator-starter

分布式环境不同于单机系统,对ID生成有着更为严苛的需求,具体如下:

  • 全局唯一,这是基本要求,不能出现重复。
  • 单调递增,连续的,下一个ID要大于上一个ID,这主要是从MySQL InnoDB存储引擎的性能来考虑的。
  • 长度,长度越短需要的存储空间越小,同时还能够提高查询效率,使用MySQL时尤为突出。
  • 高可用,无单点隐患
  • 高性能,生成速度快,延时低,扛住高并发

常用的分布式ID生成方案

UUID

优点: 开发语言本身提供实现,足够简单;全球唯一;无性能问题

缺点:长度过大,不利于存储和检索;非单调递增,对MySQL索引不利(作为数据库主键,在InnoDB引擎下,UUID的无序性可能会引起数据位置频繁变动,严重影响性能)

数据库自增主键

基于数据库的自增主角,单独使用一个数据库实例作全局ID生成器。

优点:实现简单;单调递增;数值类型,长度合适,查询速度快

缺点:强依赖数据,存在单点隐患;存在性能问题,无法抗住高并发

数据库多实例自增主键

每个数据库设置固定的step增长步长,使得每个数据库生成的主键单调递增且不重复,如:DB1生成1、4、7、10;DB2生成2、5、8、11;DB3生成3、6、9、12

优点:无单点隐患;平衡负载

缺点:需固定步长,扩容困难;单库压力依然大;应用较为复杂

类Snowflake算法

使用twitter开源的Snowflake算法,其构造如下:

snowflake

优点:高性能(每秒生成百万ID);单调递增

缺点:强依赖机器时钟,存在时钟回拨问题(会导致重复的ID生成)

uid-generator

uid-generator是由百度开源的基于Snowflake算法的唯一ID生成器,使用java语言实现。uid-generator以组件形式工作在应用项目中, 支持自定义workerId位数和初始化策略, 从而适用于docker等虚拟化环境下实例自动重启、漂移等场景。 在实现上, uid-generator通过借用未来时间来解决sequence天然存在的并发限制; 采用RingBuffer来缓存已生成的UID, 并行化UID的生产和消费, 同时对CacheLine补齐,避免了由RingBuffer带来的硬件级「伪共享」问题. 最终单机QPS可达600万。

uid-generator项目详情: 请点击

uid-generator对Snowflake算法生成的ID构造做了调整,如下:

uid-generator snowflake id

worker node id 为每个工作节点的ID(机器、应用实例),uid-generator提供接口可由用户自行实现其生成方式,默认是基于数据库生成。

uid-generator解决时间回拨问题、提升性能主要是通过如下技术手段实现:

1、动态递增worker node id : 每次启动都会往数据库WORKER_NODE表中插入一条记录,插入成功后返回的该数据对应的自增唯一主键,此主键就作为该应用实例的worker node id 。保证每个应用实例、每次启动所获取的worker node id 都不同,因此不会出现生成重复的ID。即使时钟回拨,因为workerId不同,也不会出现ID冲突

2、RingBuffer: RingBuffer本质是一个数组,uid-generator利用RingBuffer数据结构预先生成若干个ID并缓存,当需要获取ID时候,如果数组中有则优先使用缓存的ID,这样可极大提高效率与吞吐量

3、未来时间:大部分snowflake算法的实现都会使用System.currentTimeMillis()来获取时间戳,这样严重依赖服务器的时间。uid-generator使用填充完RingBuffer时的时间戳作为lastSecond(AtomicLong类型),下次填充时使用lastSecond.incrementAndGet()来获取新的时间戳,非使用System.currentTimeMillis(),规避了时钟回拨问题。

uid-generator-starter

从官网说明或者其他网上的使用教程可见,将uid-generator集成到springboot项目中,还是有点小麻烦的。uid-generator-starter对uid-generator进行了Springboot Starter风格的封装,只要一行注解便可将其集成到项目中,同时还增加一些实用的特性:

  1. spring-boot-starter风格的开箱即用。

  2. 可为uid-generator独立设置数据源,和业务系统的主数据源分开。

  3. 支持使用ZooKeeper进行WORKER ID分配,藉由ZK的Paxos强一致性算法获取更高的可用性。

开源地址

github:uid-generator-starter

如果此工具对你有帮助,请在github中Star支持下

快速开始

1、引入uid-generator-starter

<dependency>
    <groupId>com.github</groupId>
    <artifactId>uid-generator-starter</artifactId>
    <version>最新的版本号</version>
</dependency>

2、在数据库(mysql)中创建WORKER_NODE表

DROP TABLE IF EXISTS WORKER_NODE;
CREATE TABLE WORKER_NODE
(
    ID BIGINT NOT NULL AUTO_INCREMENT COMMENT 'auto increment id',
    HOST_NAME VARCHAR(64) NOT NULL COMMENT 'host name',
    PORT VARCHAR(64) NOT NULL COMMENT 'port',
    TYPE INT NOT NULL COMMENT 'node type: ACTUAL or CONTAINER',
    LAUNCH_DATE DATE NOT NULL COMMENT 'launch date',
    MODIFIED TIMESTAMP NOT NULL COMMENT 'modified time',
    CREATED TIMESTAMP NOT NULL COMMENT 'created time',
    PRIMARY KEY(ID)
)
COMMENT='DB WorkerID Assigner for UID Generator',ENGINE = INNODB;

3、注解启用uid-generator

@Transactional
@EnableUidGenerator //启用uid-generator
@SpringBootApplication
public class Application {
    public static void main(String[] args) {
        SpringApplication.run(Application.class, args);
    }
}

4、使用UidGenerator

@Resource
private UidGenerator uidGenerator;

@Test
public void contextLoads()  {
    for(int i=0;i<100;i++) {
        System.out.println("uid:"+uidGenerator.getUID());
    }
}

使用独立的数据源

在数据库uid-db中创建WORKER_NODE表,使用其作为uid-generator的专用数据库

每个业务系统只需将uid-generator的数据库设置为uid-db即可

#---------------------- 业务配置   -----------------------
spring:
  datasource: #业务数据源
    driver-class-name: com.mysql.cj.jdbc.Driver
    url: jdbc:mysql://127.0.0.1:3306/yewu1
    password: admin
    username: 123456
#---------------------- uid-generator   -----------------------
uid-generator: 
  #time-bits: 28 #可选配置, 如未指定将采用默认值
  #worker-bits: 22 #可选配置, 如未指定将采用默认值
  #seq-bits: 13 #可选配置, 如未指定将采用默认值
  #epoch-str: 2020-10-21 #可选配置, 如未指定将采用默认值(2020-10-21)
  #boost-power: 3 #可选配置, 如未指定将采用默认值
  #padding-factor: 50 #可选配置, 如未指定将采用默认值
  #schedule-interval:  #可选配置, 如未指定则不启用此功能
  datasource: #使用独立的数据源,如未指定将采用应用系统的数据源
    driver-class-name: com.mysql.cj.jdbc.Driver
    url: jdbc:mysql://192.168.1.666:3306/uid-db
    password: admin
    username: 123456

使用zookeeper

作为一个专门为分布式应用提供一致性服务的软件,使用zookeeper作为workerId的配置维护工具再合适不过了,如果你的系统追求高度可用性,强烈推荐使用zookeeper集群。

#---------------------- 业务配置   -----------------------
spring:
  datasource: #业务数据源
    driver-class-name: com.mysql.cj.jdbc.Driver
    url: jdbc:mysql://127.0.0.1:3306/yewu?
    password: admin
    username: 123456
#---------------------- uid-generator   -----------------------
uid-generator: 
  #time-bits: 28 #可选配置, 如未指定将采用默认值
  #worker-bits: 22 #可选配置, 如未指定将采用默认值
  #seq-bits: 13 #可选配置, 如未指定将采用默认值
  #epoch-str: 2016-05-20 #可选配置, 如未指定将采用默认值
  #boost-power: 3 #可选配置, 如未指定将采用默认值
  #padding-factor: 50 #可选配置, 如未指定将采用默认值
  #schedule-interval:  #可选配置, 如未指定则不启用此功能
  #datasource: #使用独立的数据源,如未指定将采用应用系统的数据源
    #driver-class-name: com.mysql.cj.jdbc.Driver
    #url: jdbc:mysql://192.168.1.666:3306/uid-db
    #password: root
    #username: root
  zookeeper: 
    #zk连接地址,集群模式则用逗号分开,如: 192.168.1.333:2181,192.168.1.555:2182,192.168.1.66:2183
    addrs: 192.168.1.333:2181 
    #authentication: admin:123456 #digest类型的访问秘钥,如:user:password,默认为不使用秘钥