生物資訊百Jia軟體(24) trf

2021-09-26 02:38:29 字數 1439 閱讀 2332

編者按

trf可以用於串聯重複序列的查詢,因為這是基因組上的顯著特徵,因此查詢起來並不難,這個串聯重複序列也就是所謂的拷貝數變異cnv。那麼為何不能用trf來找cnv呢,其實是完全可以的,現在沒法這麼用,是因為無法得到全基因組序列。

一、功能分類:

串聯重複序列**

二、軟體官網:

三、軟體介紹:

trf是(tandem repeat finder)的簡稱,用來搜尋dna 序列中的串聯重複序列(即相臨的重複兩次或多次特定核酸序列模式的重複序列)。重複單元可以從1bp 到500bp,dna 查詢序列大小可以超過5m。

mv trf409.linux64 trf

五、軟體使用:

trf file match mismatch delta pm pi minscore maxperiod

軟體首先輸入要**串聯重複序列的基因組檔案,後面跟幾組必須的值。

首先接file,

file: fasta 格式的dna 輸入序列.

match:匹配上

mismatch:沒匹配上

delta: 插入的權重值。低的權重值將允許更多的「沒匹配上」、「插入」的情況。匹配上的權重值「2」已被證明對「沒匹配上」、「插

入」的罰分權重值在3-7 範圍內都是有效的。「沒匹配上」、「插入」的罰分權重值將被 自動解釋為負值。「3」就比較寬鬆,「7」就比較嚴格。

對match, mismatch, delta 的推 薦預設值分別為2, 7, 7。

pm 是指比上的概率,可選擇的pm 數值為80 和75,

pi 是插入的概率:可選擇的pi 數值為10 和20。最好效果的引數是pm=80 和pi=10。引數pm=75 和pi=20 給出的結果與 「pm=80 和pi=10」的結果相似,但執行時間幾乎慢了10 倍。

minscore: 被匹配上的串聯重複序列的最小分值。比如,我們設定了match=2,minscore=50, 那麼就要求最少有25bp 被完全比上(比如,5bp 的重複單元,重複5 次)。

maxperiod: 最大的重複單元bp 數。

下面是一些可選的選項

-m: 該引數將產生乙個將串聯重複序列遮蔽為n 的序列檔案。

-f: 該引數將輸出每一串聯重複序列兩側200bp 的側翼序列,輸出到比對檔案中。

-d: 該引數將產生乙個遮蔽檔案,記錄了與列表檔案一樣的資訊,及比對資訊,可用於後續程 序的處理。

六、使用案例:

trf seq.fa 2 7 7 80 10 50 500 -f -d -m

七、結果說明:

最終會生成.mask .dat .html格式結尾的結果檔案,

*.dat 「-d」引數產生的遮蔽的串聯重複序列資訊檔案

*.mask「-m」 引數產生的串聯重複序列被遮蔽為n 的序列檔案

*.html 記錄串聯重複序列資訊的檔案

*.txt.html 記錄相關串聯重複序列比對資訊的檔案

生物資訊百Jia軟體(八) blat

一 功能分類 區域性比對 二 軟體官網 三 軟體介紹 blat的全稱是the blast like alignment tool,可以稱為 類blast 比對工具 由w.james kent於2002年開發。當時隨著人類基因組計畫的進展,把大量基因和ests 快速定位到較大的基因組上成為一種迫切的需...

生物資訊百Jia軟體(十三) clustalw

通哥點評 clustalw是一款經典的多序列比對工具,在高通量測序開始之前已經被廣泛使用了,具有非常高的引用率。可以進行多個同源基因的多序列比對,比對完成之後可以用於構建分子數。在高通量測序時代,clustalw依然具有重要的作用。是一款需要掌握的生物資訊工具。一 功能分類 多序列比對 二 軟體官網...

生物資訊百Jia軟體(十六) tRNAscan

通哥點評 與rnammer工具類似,trnascan專門用於轉運rna的 由於轉運rna具有固定模式,而且非常顯著的倒三葉草模式,因此 並不難,準確性也比較高,所以,在這個分析方面基本上沒有對手,也沒有太多類似的工具,對於trna 掌握這一款工具就差不過夠了。一 功能分類 轉運rna 二 軟體官網 ...