最長公共子串行

乙個字串s，去掉零個或者多個元素所剩下的子串稱為s的子串行。最長公共子串行就是尋找兩個給定序列的子串行，該子串行在兩個序列中以相同的順序出現，但是不必要是連續的。

例如序列x=abcbdab，y=bdcaba。序列bca是x和y的乙個公共子串行，但是不是x和y的最長公共子串行，子串行bcba是x和y的乙個lcs，序列bdab也是。

尋找lcs的一種方法是列舉x所有的子串行，然後注意檢查是否是y的子串行，並隨時記錄發現的最長子序列。假設x有m個元素，則x有2^m個子序列，指數級的時間，對長序列不實際。

使用動態規劃求解這個問題，先尋找最優子結構。設x=1,x2,…,xm>和y=1,y2,…,yn>為兩個序列，lcs(x,y)表示x和y的乙個最長公共子串行，可以看出

如果xm=yn，則lcs ( x,y ) = xm + lcs ( xm-1,yn-1 )。

如果xm!=yn，則lcs( x,y )= max

lcs問題也具有重疊子問題性質：為找出x和y的乙個lcs，可能需要找x和yn-1的乙個lcs以及xm-1和y的乙個lcs。但這兩個子問題都包含著找xm-1和yn-1的乙個lcs，等等.

dp最終處理的還是數值（極值做最優解），找到了最優值，就找到了最優方案；為了找到最長的lcs，我們定義dp[i][j]記錄序列lcs的長度，合法狀態的初始值為當序列x的長度為0或y的長度為0，公共子串行lcs長度為0，即dp[i][j]=0，所以用i和j分別表示序列x的長度和序列y的長度，狀態轉移方程為

dp[i][j] = 0 如果i=0或j=0

dp[i][j] = dp[i-1][j-1] + 1 如果x[i-1] = y[i-1]

dp[i][j] = max 如果x[i-1] != y[i-1]

動態規劃法

經常會遇到複雜問題不能簡單地分解成幾個子問題，而會分解出一系列的子問題。簡單地採用把大問題分解成子問題，並綜合子問題的解匯出大問題的解的方法，問題求解耗時會按問題規模呈冪級數增加。

為了節約重複求相同子問題的時間，引入乙個陣列，不管它們是否對最終解有用，把所有子問題的解存於該陣列中，這就是動態規劃法所採用的基本方法。

【問題】

求兩字串行的最長公共字元子串行

問題描述：字串行的子串行是指從給定字串行中隨意地（不一定連續）去掉若干個字元（可能乙個也不去掉）後所形成的字串行。令給定的字串行x=

「x0，x1

，…，xm-1」，序列y=

「y0，y1

，…，yk-1」是x

的子串行，存在x

的乙個嚴格遞增下標序列，i1

，…，ik-1>

，使得對所有的j=0

，1，…，k-1

，有xij=yj

。例如，x=

「abcbdab

」，y=

「bcdb

」是x的乙個子串行。

考慮最長公共子串行問題如何分解成子問題，設a=

「a0，a1

，…，am-1」，b=

「b0，b1

，…，bm-1」，並z=

「z0，z1

，…，zk-1」為它們的最長公共子串行。不難證明有以下性質：（1

）如果am-1=bn-1

，則zk-1=am-1=bn-1

，且「z0

，z1，…，zk-2」是「a0

，a1，…，am-2」和「b0

，b1，…，bn-2」的乙個最長公共子串行；（2

）如果am-1!=bn-1

，則若zk-1!=am-1

，蘊涵「z0

，z1，…，zk-1」是「a0

，a1，…，am-2」和「b0

，b1，…，bn-1」的乙個最長公共子串行；（3

）如果am-1!=bn-1

，則若zk-1!=bn-1

，蘊涵「z0

，z1，…，zk-1」是「a0

，a1，…，am-1」和「b0

，b1，…，bn-2」的乙個最長公共子串行。

這樣，在找a

和b的公共子串行時，如有am-1=bn-1

，則進一步解決乙個子問題，找「a0

，a1，…，am-2」和「b0

，b1，…，bm-2」的乙個最長公共子串行；如果am-1!=bn-1

，則要解決兩個子問題，找出「a0

，a1，…，am-2」和「b0

，b1，…，bn-1」的乙個最長公共子串行和找出「a0

，a1，…，am-1」和「b0

，b1，…，bn-2」的乙個最長公共子串行，再取兩者中較長者作為a

和b的最長公共子串行。

求解：引進乙個二維陣列c，用c[i][j]記錄x[i]與y[j] 的lcs 的長度，b[i][j]記錄c[i][j]是通過哪乙個子問題的值求得的，以決定搜尋的方向。

我們是自底向上進行遞推計算，那麼在計算c[i,j]之前，c[i-1][j-1]，c[i-1][j]與c[i][j-1]均已計算出來。此時我們根據x[i] = y[j]還是x[i] != y[j]，就可以計算出c[i][j]。

問題的遞迴式寫成：

回溯輸出最長公共子串行過程：

演算法分析：

由於每次呼叫至少向上或向左（或向上向左同時）移動一步，故最多呼叫(m + n)次就會遇到i = 0或j = 0的情況，此時開始返回。返回時與遞迴呼叫時方向相反，步數相同，故演算法時間複雜度為θ(m + n)。

[cpp]view plain

copy

#include "iostream"

#include "string"

#include "vector"

using

namespace

std;

std::vector

> common;

intlcs(string a,string b)

for(

inti = 1; i <= a.size(); ++i)

else

if(len[i-1][j] >= len[i][j-1])

else

} } int

apos = a.size();

intbpos = b.size();

intcommonlen = len[apos][bpos];

intk = commonlen;

common.resize(commonlen);

while

(apos && bpos)else

if(len[apos-1][bpos] >= len[apos][bpos-1])

else

} for(

inti = 0;i

cout

commonlen;

} int

main(

intargc,

char

const

*argv)

最長公共子串行

最長公共子串行最長公共子串

最長公共子串行最長公共子串

最長公共子串最長公共子串行

最長公共子串行

最長公共子串行 最長公共子串

最長公共子串行 最長公共子串

最長公共子串 最長公共子串行

相關推薦

最長公共子串行最長公共子串

最長公共子串行最長公共子串

最長公共子串最長公共子串行