(Snowflake Algorithm)雪花算法Java的简单使用

2024-04-28 23:52

本文主要是介绍(Snowflake Algorithm)雪花算法Java的简单使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

概述

雪花算法(Snowflake Algorithm)最初是由Twitter开源的,用于生成一个64位的长整型数字作为全局唯一的ID。这个算法是用Scala语言编写的,并且在Twitter内部得到了广泛应用。由于其简单、高效和分布式友好的特性,雪花算法后来也被其他很多公司和项目采用,并可能被移植到其他编程语言中实现。

其结构如下:

  1. 第一位:未使用,因为二进制中最高位是符号位,正数是0,负数是1,一般生成的ID为正数,所以默认为0。
  2. 接下来的41位:用来记录时间戳(毫秒)。
  3. 接下来的10位:用来记录工作机器ID,包括5位datacenterId和5位workerId。10位的长度最多支持部署在1024个节点(即机器或数据中心)上。
  4. 最后的12位:序列号,用来记录同毫秒内产生的不同ID序号,12位的计数顺序号支持每个节点每毫秒(同一机器,同一时间截并发量)可以产生 4096 个 ID 序号。

雪花算法的优点包括:

  1. 毫秒数在高位,生成ID整体上按时间趋势递增;
  2. 不依赖数据库等第三方系统,以服务的方式部署,稳定性更高,生成ID的性能也是非常高的;
  3. 可以根据自身业务特性分配bit位,非常灵活。

然而,雪花算法也有其局限性,比如当数据中心ID或工作机器ID达到上限时,就需要进行扩容或重新规划。此外,如果时钟回拨,可能会导致生成的ID出现冲突或不符合预期的情况,虽然可以通过一些策略进行避免,但仍需注意处理这类情况。

总的来说,雪花算法是一种简单、高效、灵活的分布式ID生成算法,适用于大多数分布式系统场景。但在使用时,需要根据自身业务特性和需求进行合理规划和调整。

基于Java实现的雪花算法工具类

package com.desmond.common.utils;public class SnowflakeIdWorker {/** 开始时间截 (2015-01-01) 可自定义修改 */private final long twepoch = 1288834974657L;/** 机器id所占的位数 */private final long workerIdBits = 5L;/** 数据标识id所占的位数 */private final long datacenterIdBits = 5L;/** 支持的最大机器id,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */private final long maxWorkerId = -1L ^ (-1L << workerIdBits);/** 支持的最大数据标识id,结果是31 */private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);/** 序列在id中占的位数 */private final long sequenceBits = 12L;/** 机器ID向左移12位 */private final long workerIdShift = sequenceBits;/** 数据标识id向左移17位(12+5) */private final long datacenterIdShift = sequenceBits + workerIdBits;/** 时间截向左移22位(5+5+12) */private final long timestampLeftShift = sequenceBits + workerIdBits+ datacenterIdBits;/** 生成序列的掩码,这里为4095 (0b111111111111=0xfff=4095) */private final long sequenceMask = -1L ^ (-1L << sequenceBits);/** 工作机器ID(0~31) */private long workerId;/** 数据中心ID(0~31) */private long datacenterId;/** 毫秒内序列(0~4095) */private long sequence = 0L;/** 上次生成ID的时间截 */private long lastTimestamp = -1L;/*** 构造函数** @param workerId*            工作ID (0~31)* @param datacenterId*            数据中心ID (0~31)*/public SnowflakeIdWorker(long workerId, long datacenterId) {if (workerId > maxWorkerId || workerId < 0) {throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0",maxWorkerId));}if (datacenterId > maxDatacenterId || datacenterId < 0) {throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0",maxDatacenterId));}this.workerId = workerId;this.datacenterId = datacenterId;}/*** 获得下一个ID (该方法是线程安全的)** @return SnowflakeId*/public synchronized long nextId() {long timestamp = timeGen();// 如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常if (timestamp < lastTimestamp) {throw new RuntimeException(String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds",(lastTimestamp - timestamp)));}// 如果是同一时间生成的,则进行毫秒内序列if (lastTimestamp == timestamp) {sequence = (sequence + 1) & sequenceMask;// 毫秒内序列溢出if (sequence == 0) {// 阻塞到下一个毫秒,获得新的时间戳timestamp = tilNextMillis(lastTimestamp);}}// 时间戳改变,毫秒内序列重置else {sequence = 0L;}// 上次生成ID的时间截lastTimestamp = timestamp;// 移位并通过或运算拼到一起组成64位的IDreturn ((timestamp - twepoch) << timestampLeftShift) //| (datacenterId << datacenterIdShift) //| (workerId << workerIdShift) //| sequence;}/*** 阻塞到下一个毫秒,直到获得新的时间戳** @param lastTimestamp*            上次生成ID的时间截* @return 当前时间戳*/protected long tilNextMillis(long lastTimestamp) {long timestamp = timeGen();while (timestamp <= lastTimestamp) {timestamp = timeGen();}return timestamp;}/*** 返回以毫秒为单位的当前时间** @return 当前时间(毫秒)*/protected long timeGen() {return System.currentTimeMillis();}// 测试public static void main(String[] args) {SnowflakeIdWorker idWorker = new SnowflakeIdWorker(1, 2);for (int i = 0; i < 10; i++) {long id = idWorker.nextId();System.out.println(id);}}
}

使用例子

Java框架为SpringBoot

在雪花算法中,机器ID(workerID)和数据中心ID(datacenterID)是确保生成的ID全局唯一性的两个关键参数。

机器ID主要用于标识分布式系统中的不同工作机器。每个工作节点需要分配一个唯一的workerID,以确保在同一个数据中心下的不同工作节点之间生成的ID不会重复。通过这种方式,雪花算法可以确保即使在高度分布式的环境中,也能生成唯一的ID。

数据中心ID则用于标识不同的数据中心。在分布式系统中,可能有多个数据中心在运行,每个数据中心都可能有多个工作机器。通过为每个数据中心分配一个唯一的datacenterID,雪花算法可以确保在多个数据中心之间生成的ID也不会重复。

这两个参数的具体值通常是根据实际部署环境来设定的。例如,机房号、机器号、服务号或其他可区别标识的比特位整数值都可以被用作这两个参数的设定依据。

总的来说,机器ID和数据中心ID是雪花算法实现全局唯一ID生成的重要组成部分,它们共同确保了即使在复杂的分布式环境中,也能生成唯一且有序的ID。

# yml配置工作id 和 数据中心idSnowflakeId:workerId: 1dataCenterId: 1
    @Value("${SnowflakeId.workerId}")private Integer WORKER_ID;@Value("${SnowflakeId.dataCenterId}")private Integer DATACENTER_ID;
    public String GetSystemserialnumber() {SnowflakeIdWorker idWorker = new SnowflakeIdWorker(WORKER_ID, DATACENTER_ID);long SnowflakeId = idWorker.nextId();//返回的字符串示例:TEST1784571656338149378return "TEST" + SnowflakeId;}

这篇关于(Snowflake Algorithm)雪花算法Java的简单使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/944597

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

一篇文章彻底搞懂macOS如何决定java环境

《一篇文章彻底搞懂macOS如何决定java环境》MacOS作为一个功能强大的操作系统,为开发者提供了丰富的开发工具和框架,下面:本文主要介绍macOS如何决定java环境的相关资料,文中通过代码... 目录方法一:使用 which命令方法二:使用 Java_home工具(Apple 官方推荐)那问题来了,

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置