字串雜湊就是將乙個字串對映成乙個p進製的數,然後用字首記錄下來,當你查詢某個字串的雜湊值時,只要用字首相減就可以了。通常p取131或者13331來盡可能減少衝突,同時用unsigned long long值過大自動溢位避免手動取模
eg:s = "abacbdab", h是字首和,v是字元的值
h[1] = v[a], h[2] = h[1] * p + v[b],h[3] = h[2] * p + v[a] ... h[7] = h[6] * p + v[a],h[8] = h[7] * p + v[b]
當求某個子串的雜湊值時,由於我們這裡看到的是
"abacbdab" = a * p^7 + b * p^6 + a * p^5 + c * p^4 + b * p^3 + d * p^2 + a * p^1 + b * p^0
那麼如果求子串"cbd"的雜湊值,則就是說"cbd" = c * p^2 + b * p^1 + d * p^0 (1)
而在母串中"cbd" = c * p^6 + b * p^5 + d * p^4 (2)
根據字首和的思想,"cbd" = h[6] - h[3]得到的結果是(2),而我們要得到的結果是(1)
故我們需要對其進行處理:
對於p進製的數的表示:
h[6]是 abacbd
h[3]是 aba
故如果要得到4~6的雜湊值則:有hash[4~6] = h[6] - h[3] * p^(6 - 4 + 1)
判斷兩個子串就是分別求出兩個子串雜湊值判斷下即可。
模板題傳送門:
字串雜湊
參照演算法筆記p109,甲級1039 先假設字串均由大寫字母a z構成。在這個基礎上,不妨把a z視為0 25,這樣就把26個大寫字母對應到了26進製中。接著,按照將26進製轉化為10進製的思路,由進製的轉換結論可知,在進製轉換過程中,得到的10進製肯定是唯一的,由此便可實現將字串對映為整數的需求 ...
字串雜湊
昨天做了一道字串雜湊的題,感覺還好理解。今天的題看了 不知道為什麼,搜來搜去發現不知道的東西還很多,網上找到的東西也都是很零散,書上也沒有系統的講解。先自己整理一下這些零散的知識 關於字串涉及到的演算法大概有 hash kmp trie ac自動機等等,現在還都不明白是怎麼回事,這次先研究字串has...
字串雜湊
給定乙個長度為n的字串,再給定m個詢問,每個詢問包含四個整數l1,r1,l2,r2,請你判斷 l1,r1 和 l2,r2 這兩個區間所包含的字串子串是否完全相同。字串中只包含大小寫英文本母和數字。輸入格式 第一行包含整數n和m,表示字串長度和詢問次數。第二行包含乙個長度為n的字串,字串中只包含大小寫...