大家都知道,基因可以看作乙個鹼基對序列。它包含了4種核苷酸,簡記作a,c,g,t。生物學家正致力於尋找人類基因的功能,以利用於診斷疾病和發明藥物。
在乙個人類基因工作組的任務中,生物學家研究的是:兩個基因的相似程度。因為這個研究對疾病的**有著非同尋常的作用。
兩個基因的相似度的計算方法如下:
對於兩個已知基因,例如agtgatg和gttag,將它們的鹼基互相對應。當然,中間可以加入一些空鹼基-,例如:
這樣,兩個基因之間的相似度就可以用鹼基之間相似度的總和來描述,鹼基之間的相似度如下表所示:
那麼相似度就是:(-3)+5+5+(-2)+(-3)+5+(-3)+5=9。因為兩個基因的對應方法不唯一,例如又有:
相似度為:(-3)+5+5+(-2)+5+(-1)+5=14。規定兩個基因的相似度為所有對應方法中,相似度最大的那個。
輸入格式:
共兩行。每行首先是乙個整數,表示基因的長度;隔乙個空格後是乙個基因序列,序列中只含a,c,g,t四個字母。1<=序列的長度<=100。
輸出格式:
僅一行,即輸入基因的相似度。
輸入樣例#1:
7 agtgatg輸出樣例#1:5 gttag
14問題分析
資料處理:
將字串轉換成陣列a與b,並打出tab表來表示匹配值。用dp[i][j]表示第乙個陣列的前i行和第二個陣列的前j行的相似度。
轉移方程:
我們可以選擇將a[i]與b[j]直接配對,或者將a[i]或b[j]與空格配對。這樣可以得到轉移方程dp[i][j]=max(dp[i-1][j-1]+tab[a[i]][b[j]],dp[i-1][j]+tab[a[i]][4],dp[i][j-1]+tab[4][b[j]])。
邊界處理:
如果乙個串為空,則另乙個一定全部對應的是空格,於是可設定dp[0][i]與dp[i][0]的初值。dp[0][0]設為0,因為空格與空格對應為0(很重要)。
**
#includeusing namespace std;
const int n=210;
const int tab[5][5]=
, ,,,
};char x[n],y[n];
int n,m,a[n],b[n],dp[n][n];
int main()
printf("%d",dp[n][m]);
return 0;
}
洛谷P1140 相似基因
大家都知道,基因可以看作乙個鹼基對序列。它包含了44種核苷酸,簡記作a,c,g,ta,c,g,t。生物學家正致力於尋找人類基因的功能,以利用於診斷疾病和發明藥物。在乙個人類基因工作組的任務中,生物學家研究的是 兩個基因的相似程度。因為這個研究對疾病的 有著非同尋常的作用。兩個基因的相似度的計算方法如...
洛谷P1140 相似基因
本題一看就知道是一道動歸,其實和字串距離非常的像,只不過多了題目規定的匹配相似度罷了。int shuzu 6 6 ps 換行效果更佳。int start char c 然後直接在主函式中呼叫即可 for int i 0 i其中s1,s2均為讀入的字串,我們把它們分別逐字元轉化放入a,b陣列。for ...
洛谷P1140 相似基因
本題一看就知道是一道動歸,其實和字串距離非常的像,只不過多了題目規定的匹配相似度罷了。int shuzu 6 6 ps 換行效果更佳。int start char c 然後直接在主函式中呼叫即可 for int i 0 i其中s1,s2均為讀入的字串,我們把它們分別逐字元轉化放入a,b陣列。for ...