實現乙個簡單的發號器
根據snowflake演算法的原理實現乙個簡單的發號器,產生不重複、自增的id。
1.snowflake演算法的簡單描述
這裡的snowflake演算法是用二進位制的,有64位。其中41位的時間戳表示:當前時間戳減去某個設定的起始時間,10位標識表示:不同的機器、資料庫的標識id等等,序列號為每秒或每毫秒內自增的id。
我做的時候沒有用位運算去實現,而是做了乙個十進位制的,16位的(當時專案要求是16位的)。但是實現發號器的基本策略是一樣的,通過時間戳和標識來防止重複,通過序列號實現自增。當然啦,重點不是發號器多少位,而是根據專案的實際情況,利用snowf程式設計客棧lake演算法的原理,實現乙個適合自己專案的發號器。
2.python實現
時間戳:9位,起始時間為2018-01-01 00:00:00 ,時間戳為當前時間減去起始時間。時間戳有9為,可用時間為 999999999/(606024*365)≈31(年)。
標識id:2位,我用的時候比較簡單,只是涉及乙個資料庫的情況,所以用一張資料表對應乙個標識id,可用100張表。
序列號:5位,我時間戳用的是秒級www.cppcns.com的,但是5位是10萬個序列號,經過測試在一秒內是完全夠用的。
所以時間戳、標識id、序列號的位數也沒規定說一定要多少,根據自己專案的實際來即可。
**如下:
import time
class mysnow:
def __init__(self,dataid):
self.start = int(time.mktime(time.strptime('2018-01-01 00:00:00', "%y-%m-%d %h:%m:%s")))
self.last = int(time.time())
self.countid = 0
self.dataid = dataid # 資料id,這個自定義或是對映
def get_id(self):
# 時間差部分
now = int(time.time())
temp = now-self.start
if len(str(temp)) < 9: # 時間差不夠9位的在前面補0
length = len(str(temp))
s = "0" * (9-length)
temp = s + str(temp)
if now == self.last:
self.countid += 1 # 同一時間差,序列號自增
else:
self.countid = 0 # 不同時間差,序列號重新置為0
self.last = now
程式設計客棧 # 標識id部分
if len(str(self.dataid)) < 2:
length = len(str(self.dataid))
s = "0" * (2-length)
self.dataid = s + str(self.dataid)
# 自增序列號部分
if self.countid == 99999: # 序列號自增5位滿了,睡眠一秒鐘
time.sleep(1)
countiddata = str(self.countid)
if len(countiddata) < 5: # 序列號不夠5位的在前面補0
length = len(countiddata)
s = "0"*(5-length)
countiddata = s + countiddata
id = str(temp) + str(self.dataid) + cou程式設計客棧ntiddata
return id
使用方法:
snow = mysnow(dataid="00")
print(snow.get_id())
其中dataid即為標識id,countid為自增序列號。da可以乙個通過自定義的對映表獲得,這個視實際的專案情況而定。
3.關於併發
首先,直接用這個發號器是不能進行併發操作,會產生重複的id。如果真的要進行併發,那麼就要權衡一下併發和位數的哪個更重要了!
拿實際例子來說吧,比如我併發的目的是為了節省時間,讓程式更快的跑完,這時候為了併發,我把dataid中拿出一位來,標識不同的子程序,這樣可以防止產生重複的id。但是實際上這用了位數去換取時間,如果是id位數比較少的情況,比如16位的,dataid比較少,我個人認為這樣是不值得的,有些奢侈。這時候便是位數比併發重要啦。
當時如果位數充裕,比如20位的,需要併發就併發啦。
還有一種實現併發的方法,就是給發號器加鎖,發號的時候加鎖,發完了解鎖。這個我沒有試過,有興趣的可以試一下哈哈。但是我有個疑惑啊,就是不斷加鎖和解鎖切換,帶來的時間和資源開銷會不會很大呢。
本文標題: 如何通過雪花演算法用python實現乙個簡單的發號器
本文位址:
如何通過Python實現標籤雲演算法
實現原理 標籤雲最終展現出來的效果其實是由兩個html引數來控制的,分別是 font size和color,如 django 標籤關聯的文章越多,表示這個標籤被引用的次數越大,font size的值也越大,color的顏色越深。考慮到體驗效果,font size不能隨著的標籤的引用次數的增大而無限增...
如何通過python連線sqlserver
coding utf 8 import pymssql server 127.0.0.1 連線伺服器位址 user sqluser 連線帳號 password password 連線密碼 with pymssql.connect server,user,password,yourdatabase c...
用python通過139郵箱傳送Email
1.註冊139郵箱,在設定中開啟郵箱協議設定,如圖所示 2.編寫 本人在anaconda的jupyter notebook中測試成功。如下 coding utf 8 無法成功,需要第三代申請密碼保護 import smtplib from email.mime.text import mimetex...