最近我在做乙個專案,其中要用到乙個資料結構——hash table(雜湊表),以前只有理論知識,現在實卻發現很不簡單,所以寫下來和大家共分享。
我們知道,雜湊表是乙個固定大小的陣列,陣列的每個元素是乙個鍊錶(單向或雙向)的頭指標。如果key一樣,則在一起,如果key不一樣,則不在一起。雜湊表的查詢是飛快的。因為它不需要從頭搜尋,它利用key的「雜湊演算法」直接定位,查詢非常快,各種資料庫中的資料結構基本都是它。但帶來的問題是,雜湊表的尺寸、雜湊演算法。
雜湊表的陣列是定長的,如果太大,則浪費,如果太小,體現不出效率。合適的陣列大小是雜湊表的效能的關鍵。雜湊表的尺寸最好是乙個質數,最小的質數尺寸是17。
當然,根據不同的資料量,會有不同的雜湊表的大小。對於資料量很時多時少的應用,最好的設計是使用動態可變尺寸的雜湊表,那麼如果你發現雜湊表尺寸太小了,比如其中的元素是雜湊表尺寸的2倍時,我們就需要擴大雜湊表尺寸,一般是擴大一倍。下面的數庫是雜湊表變化尺寸時尺寸大小的乙個列表。
static int prime_array = ;
#define prime_array_size (28)
要使用雜湊表,就一定要用乙個雜湊演算法,來確定key值,這似乎是個很難的事,下面是乙個雜湊演算法:
typedef struct _htab htab;
static unsigned int gethashindex(htab *tabptr, const char *key) { unsigned int ha = 0; while (*key) ha = (ha * 128 + *key++) % tabptr->size;
return ha;
(其中key是乙個字串,htab就是乙個雜湊表結構, tabptr->size是雜湊表陣列的大小)
leetcode 49 雜湊 字典 質數
解法一 容易想到用counter計數然後作為key放進字典,但字典不能被hash,所以只能用桶再轉tuple,如下 class solution def groupanagrams self,strs list str list list str d for s in strs bm 0 for i...
zz 雜湊表質數數列
最近我在做乙個專案,其中要用到乙個資料結構 hash table 雜湊表 以前只有理論知識,現在實卻發現很不簡單,所以寫下來和大家共分享。我們知道,雜湊表是乙個固定大小的陣列,陣列的每個元素是乙個鍊錶 單向或雙向 的頭指標。如果key一樣,則在一起,如果key不一樣,則不在一起。雜湊表的查詢是飛快的...
JSOI2016 反質數序列
點此看題 1 11不可能多次出現,那麼我們只需要考慮為奇數的質數了,由於乙個質數是由乙個奇數和乙個偶數組成,故分成兩部分,把它當二分圖來看待,中間連的邊就表示這兩個相加為質數。把中間邊設定為inf infin f,其他邊設為1 11,然後跑最大流,因為最大流等於最小割,然而這裡如果存在起終點聯通就是...