雜湊函式的構造方法

好的雜湊函式要求：（1）計算簡單，至少雜湊函式的計算時間不應該超過其他查詢技術與關鍵字比較的時間；（2）計算出的雜湊位址分布均勻，這樣可以保證儲存空間的有效利用，並減少為處理衝突而耗費的時間。

1. 直接定址法

取關鍵字或關鍵字的某個線性函式值為雜湊位址。即h(key)=key或h(key) = a·key + b，其中a和b為常數（這種雜湊函式叫做自身函式）。

2. 數字分析法

假設某公司的員工登記表以員工的手機號作為關鍵字。手機號一共11位。前3位是接入號，對應不同運營商的子品牌；中間4位表示歸屬地；最後4位是使用者號。不同手機號前7位相同的可能性很大，所以可以選擇後4位作為雜湊位址，或者對後4位反轉（1234 -> 4321）、迴圈右移（1234 -> 4123）、迴圈左移等等之後作為雜湊位址。

數字分析法通常適合處理關鍵字位數比較大的情況，如果事先知道關鍵字的分布且關鍵字的若干位分布比較均勻，就可以考慮這個方法。

3. 平方取中法

假設關鍵字是1234、平方之後是1522756、再抽取中間3位227，用作雜湊位址。平方取中法比較適合於不知道關鍵字的分布，而位數又不是很大的情況。

4. 摺疊法

將關鍵字從左到右分割成位數相等的幾部分，最後一部分位數不夠時可以短些，然後將這幾部分疊加求和，並按雜湊表表長，取後幾位作為雜湊位址。

比如關鍵字是9876543210，雜湊表表長是3位，將其分為四組，然後疊加求和：987 + 654 + 321 + 0 = 1962，取後3位962作為雜湊位址。

摺疊法事先不需要知道關鍵字的分布，適合關鍵字位數較多的情況。

5. 除留餘數法

f(key) = key mod p (p≤m)，m為雜湊表長。這種方法不僅可以對關鍵字直接取模，也可在摺疊、平方取中後再取模。根據經驗，若雜湊表表長為m，通常p為小於或等於表長（最好接近m）的最小質數，可以更好的減小衝突。

此方法為最常用的構造雜湊函式方法。

6. 隨機數法

f(key) = random(key)，這裡random是隨機函式。當關鍵字的長度不等時，採用這個方法構造雜湊函式是比較合適的。

實際應用中，應該視不同的情況採用不同的雜湊函式。如果關鍵字是英文本元、中文字元、各種各樣的符號，都可以轉換為某種數字來處理，比如其unicode編碼。下面這些因素可以作為選取雜湊函式的參考：（1）計算雜湊位址所需的時間；（2）關鍵字長度；（3）雜湊表大小；（4）關鍵字的分布情況；（5）查詢記錄的頻率。

雜湊函式的構造方法

幾種常見的雜湊函式（雜湊函式）構造方法

雜湊表（雜湊表）二雜湊函式的構造方法

常用的構造雜湊函式的方法

雜湊函式的構造方法

幾種常見的雜湊函式（雜湊函式）構造方法

雜湊表（雜湊表） 二 雜湊函式的構造方法

常用的構造雜湊函式的方法

相關推薦

雜湊表（雜湊表）二雜湊函式的構造方法