【山外问道】什么是UUID
本文打印版下载地址
1、UUID的定义
UUID是通用唯一识别码(Universally Unique Identifier)的缩写,是一种软件建构的标准,是开放软件基金会组织在分布式计算环境领域的一部分。其目的是让分布式系统中的所有元素,都能有唯一的辨识信息,而不需要通过中央控制端来做辨识信息的指定。
UUID用来识别属性类型,在所有空间和时间上被视为唯一的标识,任何地方产生的任意一个UUID都不会有相同的值。UUID的唯一缺陷在于生成的结果串会比较长,是一个128比特的数值。
目前最广泛应用的 UUID,即是微软的 Microsoft’s Globally Unique Identifiers (GUIDs),而其他重要的应用,则有 Linux ext2/ext3 档案系统、LUKS 加密分割区、GNOME、KDE、Mac OS X 等等。
2、UUID的组成
UUID基于当前时间、计数器(counter)和硬件标识(通常为无线网卡的MAC地址)等数据计算生成。
(1)当前日期和时间:UUID的第一个部分与时间有关。
(2)时钟序列。
(3)全局唯一的IEEE机器识别号:如果有网卡,从网卡MAC地址获得,没有网卡以其他方式获得。
(4)Java Hibernate中:采用IP-JVM启动时间-当前时间右移32位-当前时间-内部计数(8-8-4-8-4)来组成UUID。
3、UUID的编码规则
UUID全局唯一标识符定义为一个字符串主键,采用32位数字组成,编码采用16进制,定义了在时间和空间都完全惟一的系统信息。
(1)1-8位采用系统时间,在系统时间上精确到毫秒级保证时间上的惟一性;
(2)9-16位采用底层的IP地址,在服务器集群中的惟一性;
(3)17-24位采用当前对象的HashCode值,在一个内部对象上的惟一性;
(4)25-32位采用调用方法的一个随机数,在一个对象内的毫秒级的惟一性。
4、UUID的版本
UUID具有多个版本,每个版本的算法不同,应用范围也不同。
(1)特例Nil UUID:通常用不到,由全为0的数字组成:00000000-0000-0000-0000-000000000000。
(2)基于时间的UUID
-
① 基于时间的UUID通过计算当前时间戳、随机数和机器MAC地址得到。
-
② 在算法中使用了MAC地址,保证了UUID在全球范围的唯一性,但会带来安全性问题。
-
③ 使用退化的算法,以IP地址来代替MAC地址--Java的UUID这样实现的。
(3)DCE安全的UUID(Distributed Computing Environment)
DCE安全的UUID和基于时间的UUID算法相同,但会把时间戳的前4位置换为POSIX的UID或GID。这个版本的UUID在实际中较少用到。
(4)基于名字的UUID
-
① 基于名字的UUID(MD5):通过计算名字和名字空间的MD5散列值得到。
-
② 基于名字的UUID(SHA1):通过计算名字和名字空间的SHA1散列值得到。
-
③ 基于名字的UUID保证了UUID的唯一性:
-
❶ 相同名字空间中不同名字生成的UUID的唯一性;
-
❷ 不同名字空间中的UUID的唯一性;
-
❸ 相同名字空间中相同名字的UUID重复生成是相同的。
-
(5)随机UUID:根据随机数,或者伪随机数生成UUID,这种UUID产生重复的概率是可以计算出来的。