KMP演算法(字串匹配)

2021-09-28 18:50:38 字數 3270 閱讀 1258

對於kmp演算法來言,我自己感覺文字介紹,方法理解起來相對於**算是簡單的,

1)kmp是乙個解決模式串在文字串是否出現過,如果出現過,最早出現的位置的經典演算法

2)knuth-morris-pratt 字串查詢演算法,簡稱為 「kmp演算法」,常用於在乙個文字串s內查詢乙個模式串p 的出現位置,這個演算法由donald knuth、vaughan pratt、james h. morris三人於2023年聯合發表,故取這3人的姓氏命名此演算法.

3)kmp方法演算法就利用之前判斷過資訊,通過乙個next陣列,儲存模式串中前後最長公共子串行的長度,每次回溯時,通過next陣列找到,前面匹配過的位置,省去了大量的計算時間

參考資料:

2.重複第一步,還是不符合,再後移

3.一直重複,直到str1有乙個字元與str2的第乙個字元符合為止

4.接著比較字串和搜尋詞的下乙個字元,還是符合。

5.遇到str1有乙個字元與str2對應的字元不符合。

7.怎麼做到把剛剛重複的步驟省略掉?可以對str2計算出一張《部分匹配表》,這張表的產生在後面介紹

8.已知空格與d不匹配時,前面六個字元」abcdab」是匹配的。查表可知,最後乙個匹配字元b對應的」部分匹配值」為2,因此按照下面的公式算出向後移動的位數:

移動位數 = 已匹配的字元數 - 對應的部分匹配值

因為 6 - 2 等於4,所以將搜尋詞向後移動 4 位。

10.因為空格與a不匹配,繼續後移一位。

11.逐位比較,直到發現c與d不匹配。於是,移動位數 = 6 - 2,繼續將搜尋詞向後移動 4 位。

13.介紹《部分匹配表》怎麼產生的

先介紹字首,字尾是什麼

「部分匹配值」就是」字首」和」字尾」的最長的共有元素的長度。以」abcdabd」為例,

-」a」的字首和字尾都為空集,共有元素的長度為0;

-」ab」的字首為[a],字尾為[b],共有元素的長度為0;

-」abc」的字首為[a, ab],字尾為[bc, c],共有元素的長度0;

-」abcd」的字首為[a, ab, abc],字尾為[bcd, cd, d],共有元素的長度為0;

-」abcda」的字首為[a, ab, abc, abcd],字尾為[bcda, cda, da, a],共有元素為」a」,長度為1;

-」abcdab」的字首為[a, ab, abc, abcd, abcda],字尾為[bcdab, cdab, dab, ab, b],共有元素為」ab」,長度為2;

-」abcdabd」的字首為[a, ab, abc, abcd, abcda, abcdab],字尾為[bcdabd, cdabd, dabd, abd, bd, d],共有元素的長度為0。

這個我們取ab為例,我們在字尾中和2個字元以上的比較,最後發現bd不行,所以有結果共有元素長度為0

14.」部分匹配」的實質是,有時候,字串頭部和尾部會有重複。比如,」abcdab」之中有兩個」ab」,那麼它的」部分匹配值」就是2(」ab」的長度)。搜尋詞移動的時候,第乙個」ab」向後移動 4 位(字串長度-部分匹配值),就可以來到第二個」ab」的位置。

**實現:

public class kmpalgorithm 

//寫出我們的kmp搜尋演算法

/***

* @param str1 源字串

* @param str2 子串

* @param next 部分匹配表, 是子串對應的部分匹配表

* @return 如果是-1就是沒有匹配到,否則返回第乙個匹配的位置

*/public static int kmpsearch(string str1, string str2, int next)

if(str1.charat(i) == str2.charat(j))

if(j == str2.length())

} return -1;

} //獲取到乙個字串(子串) 的部分匹配值表

public static int kmpnext(string dest)

//當dest.charat(i) == dest.charat(j) 滿足時,部分匹配值就是+1

if(dest.charat(i) == dest.charat(j))

next[i] = j;

} return next;

}}

我們很容易發現kmp的核心就是

while( j > 0 && str1.charat(i) != str2.charat(j)) 

while(j > 0 && dest.charat(i) != dest.charat(j))

暴力匹配法:

public class violencematch 

// 暴力匹配演算法實現

public static int violencematch(string str1, string str2) else

} //判斷是否匹配成功

if(j == str2.length()) else

}}

KMP演算法 字串匹配

kmp演算法基本思想 我們在用常規的思想做 字串匹配時候是 如 對如 字元如果 t abab 用p ba 去匹配,常規思路是 看 t 第乙個元素 a 是否 和p 的乙個 b 匹配 匹配的話 檢視各自的第二個元素,不匹配 則將 t 串的 第二個元素開始 和 p 的第乙個匹配,如此 一步一步 的後移 來...

KMP字串匹配演算法

kmp核心思想 計算模式串的next陣列,主串的索引在比較的過程中不回朔 ifndef kmp h define kmp h class kmp endif include kmp.h include include include using namespace std int kmp calcu...

KMP字串匹配演算法

在介紹kmp演算法之前,先介紹一下bf演算法。一.bf演算法 bf演算法是普通的模式匹配演算法,bf演算法的思想就是將目標串s的第乙個字元與模式串p的第乙個字元進行匹配,若相等,則繼續比較s的第二個字元和p的第二個字元 若不相等,則比較s的第二個字元和p的第乙個字元,依次比較下去,直到得出最後的匹配...