乙個dna序列由a/c/g/t四個字母的排列組合組成。g和c的比例(定義為gc-ratio)是序列中g和c兩個字母的總的出現次數除以總的字母數目(也就是序列長度)。在基因工程中,這個比例非常重要。因為高的gc-ratio可能是基因的起始點。
給定乙個很長的dna序列,以及要求的最小子序列長度,研究人員經常會需要在其中找出gc-ratio最高的子串行。
知識點: 字串
練習階段: 初級
執行時間限制: 10sec
記憶體限制: 128mbyte
輸入:
輸入乙個string型基因序列,和int型子串的長度
輸出:
找出gc比例最高的字串
樣例輸入:
aactgtgcacgacctga 5
樣例輸出:
gcacg
#include #include #include char *getsubstring(char *str,int n)
}if(maxcnt==0)
return null;
else
}}int main()
重複的DNA序列
所有 dna 由一系列縮寫為 a,c,g 和 t 的核苷酸組成,例如 acgaattccg 在研究 dna 時,識別 dna 中的重複序列有時會對研究非常有幫助。編寫乙個函式來查詢 dna 分子中所有出現超多一次的10個字母長的序列 子串 示例 輸入 s aaaaacccccaaaaacccccca...
DNA序列的編碼
description對於dna 序列 序列中包含a c g 和t 四種字元 我們使用如下方法為它編碼 1 將子字串中的k 個相同字元寫成kx,x 是a c g 和t 四個字元之一 2 如果k 是1,那麼1 要忽略。輸入乙個dna 序列,輸出它的編碼。input 乙個dna 序列,由一串包含a c ...
DNA序列相關特徵
通常是指基因序列或蛋白質序列上連續的k個核苷酸或者氨基酸。在 基於遺傳演算法的加權整合學習及其對於pirna的 中通過統計所有k元組在pirna序列上出現的次數作為最後的特徵向量。定義dna序列為x,以k個字元長度為乙個單位在序列上進行掃瞄,然後統計出所有連續k元組出現的次數。最後將4的k次方個統計...