如何實現高效地字串匹配 KMP演算法

kmp演算法是一種判斷字串中是否含有特定子串的優化演算法，效率比暴力搜尋高出許多，是乙個值得學習的演算法。

其中，最關鍵的一步就是根據子串部分匹配表來加快搜尋速度。

2.重複第一步，還是不符合，再後移

3.一直重複，直到str1有乙個字元與str2的第乙個字元符合為止

4.接著比較字串和搜尋詞的下乙個字元，還是符合。

5.遇到str1有乙個字元與str2對應的字元不符合。

7.怎麼做到把剛剛重複的步驟省略掉？可以對str2計算出一張《部分匹配表》，這張表的產生在後面介紹

8.已知空格與d不匹配時，前面六個字元」abcdab」是匹配的。查表可知，最後乙個匹配字元b對應的」部分匹配值」為2，因此按照下面的公式算出向後移動的位數：

移動位數 = 已匹配的字元數 - 對應的部分匹配值

因為 6 - 2 等於4，所以將搜尋詞向後移動 4 位。

10.因為空格與a不匹配，繼續後移一位。

11.逐位比較，直到發現c與d不匹配。於是，移動位數 = 6 - 2，繼續將搜尋詞向後移動 4 位。

13.介紹《部分匹配表》怎麼產生的

先介紹字首，字尾是什麼

「部分匹配值」就是」字首」和」字尾」的最長的共有元素的長度。以」abcdabd」為例，

－」a」的字首和字尾都為空集，共有元素的長度為0；

－」ab」的字首為[a]，字尾為[b]，共有元素的長度為0；

－」abc」的字首為[a, ab]，字尾為[bc, c]，共有元素的長度0；

－」abcd」的字首為[a, ab, abc]，字尾為[bcd, cd, d]，共有元素的長度為0；

－」abcda」的字首為[a, ab, abc, abcd]，字尾為[bcda, cda, da, a]，共有元素為」a」，長度為1；

－」abcdab」的字首為[a, ab, abc, abcd, abcda]，字尾為[bcdab, cdab, dab, ab, b]，共有元素為」ab」，長度為2；

－」abcdabd」的字首為[a, ab, abc, abcd, abcda, abcdab]，字尾為[bcdabd, cdabd, dabd, abd, bd, d]，共有元素的長度為0。

14.」部分匹配」的實質是，有時候，字串頭部和尾部會有重複。比如，」abcdab」之中有兩個」ab」，那麼它的」部分匹配值」就是2（」ab」的長度）。搜尋詞移動的時候，第乙個」ab」向後移動 4 位（字串長度-部分匹配值），就可以來到第二個」ab」的位置。

到此kmp演算法思想分析完畢!

def
kmp(str1, str2)
:"""
kmp演算法：判斷str1是否存在子串str2
:param str1:
:param str2:
:return:
"""# 子串str2的部分匹配表
match =[0
]    prefix =
for i in
range(1
,len
(str2)):
:i])
# 補充字首
# 判斷字首與字尾最長的共有元素的長度
length =
0for m in
range(1
, i+1)
:if str2[m:i+1]
in prefix:
if length < i +
1- m:
length = i +
1- m
print
(match)
i1 =
0while
true
:if i1 >
len(str1)-1
:break
substr =
''for s1, s2 in
zip(str1[i1:
], str2)
:if s1 != s2:
break
else
:                substr += s1
iflen(substr)
==len
(str2)
:return i1
elif substr =='':
i1 +=
1else
:# 這裡時最關鍵的優化：移動位數 = 已匹配的字元數 - 對應的部分匹配值
i1 +=
len(substr)
- match[
len(substr)-1
]return-1
if __name__ ==
'__main__'
:print
(kmp(
'bbc abcdab abcdabcdabde'
,'abcdabd'
))

字串匹配之KMP實現

kmp演算法看懂了覺得特別簡單，思路很簡單，看不懂之前，查各種資料，看的稀里糊塗，即使網上最簡單的解釋，依然看的稀里糊塗。kmp演算法充分利用了目標字串ptr的性質比如裡面部分字串的重複性，即使不存在重複字段，在比較時，實現最大的移動量 kmp演算法主要是next陣列的計算分析 include ...

kmp字串匹配

首先要對模式串進行預處理。預處理過程就是計算出指定位置的字首和字尾的最大相同的長度啊啊啊啊。估計只有我乙個人能看懂這個文章說得很清楚比如說 a a a c b c a a a 0 1 2 0 0 0 1 2 3 void getnext int next,char par 20 int n 翻...

字串匹配 KMP

參考從頭到尾徹底理解kmp 在字串 str 中匹配模式串 pattern 1.計算模式串的 next 陣列 2.在字串中匹配模式串當乙個字元匹配時，str i pattern k 繼續匹配下乙個字元當當前字元不匹配時，根據 next 陣列移動模式字串，k next k next 陣列描述模...

如何實現高效地字串匹配 KMP演算法

字串匹配之KMP實現

kmp字串匹配

字串匹配 KMP

相關推薦