分布式系統唯一ID設計

2021-10-03 20:41:42 字數 1644 閱讀 2663

目錄

1 概述

2 分布式唯一id特點

3 分布式唯一id傳統方案

3.1 uuid

3.2 資料庫生成

3.3 redis生成id

3.4 利用zookeeper生成唯一id

3.5 snowflake(雪花演算法)方案

在複雜分布式系統中,往往需要對大量的資料和訊息進行唯一標識如在金融、電商、支付、等產品的系統中,資料日漸增長,對資料分庫分表後需要有乙個唯一id來標識一條資料或訊息,資料庫的自增id顯然不能滿足需求,此時乙個能夠生成全域性唯一id的系統是非常必要的。

uuid(universally unique identifier)的標準型式包含32個16進製制數字,以連字型大小分為五段,形式為8-4-4-4-12的36個字元,示例:550e8400-e29b-41d4-a716-446655440000,到目前為止業界一共有5種方式生成uuid,詳情見ietf發布的uuid規範 a universally unique identifier (uuid) urn namespace。

優點:

缺點:

這個方案就是利用了mysql的主鍵自增auto_increment,預設每次id加1。

優點:

缺點:

利用redis的incr原子性操作自增,比較適合使用redis來生成每天從0開始的流水號。比如訂單號=日期+當日自增長號。

優點:

缺點:

zookeeper主要通過其znode資料版本來生成序列號,可以生成32位和64位的資料版本號,客戶端可以使用這個版本號來作為唯一的序列號。

很少會使用zookeeper來生成唯一id。主要是由於需要依賴zookeeper,並且是多步調用api,如果在競爭較大的情況下,需要考慮使用分布式鎖。因此,效能在高併發的分布式環境下,也不甚理想。

這種方案大致來說是一種以劃分命名空間(uuid也算,由於比較常見,所以單獨分析)來生成id的一種演算法,這種方案把64-bit分別劃分成多段,分開來標示機器、時間等,比如在snowflake中的64-bit分別表示如下圖所示:

41-bit的時間可以表示(1l<<41)/(1000l*3600*24*365)=69年的時間,10-bit機器可以分別表示1024臺機器。如果我們對idc劃分有需求,還可以將10-bit分5-bit給idc,分5-bit給工作機器。這樣就可以表示32個idc,每個idc下可以有32臺機器,可以根據自身需求定義。12個自增序列號可以表示2^12個id,理論上snowflake方案的qps約為409.6w/s,這種分配方式可以保證在任何乙個idc的任何一台機器在任意毫秒內生成的id都是不同的。

優點:

缺點:

參考:

1、通俗易懂:如何設計能支撐百萬併發的資料庫架構?

2、leaf——美團點評分布式id生成系統

分布式系統全域性唯一ID

全域性的唯一流水id 可以將乙個請求在分布式系統中的流轉路徑聚合。生成唯一id有兩種方法 持久型 使用資料庫表自增欄位或者sequence 生成,為了提高效率,每個應用節點可以快取乙個批次的id 如果機器重啟則可能會損失一部分id 但是這並不會產生任何問題。時間型 一般由機器號 業務號 時間 單節點...

分布式唯一ID實現

分布式唯一id實現 在業務開發中,大量場景需要用到唯一id,比如系統流水號,訂單號等等。那麼,分布式唯一id有哪些特徵呢?唯一性 生成的id全域性唯一。高可用 可保證在高併發下的可用性,確保任何時候都能正確生成id。自主性 分布式環境下不依賴中心認證,即可自行生成id。安全性 不暴露系統和業務資訊。...

分布式唯一ID方案

背景 在複雜的分布式系統中,往往需要對大量的資料和訊息進行唯一標識。如對大量的訂單做分庫分表後,需要有乙個唯一的id來標識一條資料或訊息,資料庫的自增id顯然不能滿足需求。業務系統對分布式唯一id的要求 全域性唯一性,不能重複 趨勢遞增,在mysql innodb引擎中使用的是聚集索引,由於多數rd...