bwa的使用需要兩個
輸入檔案
:reference genome data 和
short reads data
step 1: 建立 index
根據reference genome data 建立 index file
bwa index -a bwtsw reference.fa
構建索引時需要注意的問題:bwa構建索引有三種演算法,三種演算法都是基於bwt的,這三種演算法通過引數-a is 、-a div和-a bwtsw進行選擇。其中-a bwtsw對於短的參考序列是不工作的,必須要大於等於10mb;-a is(效果和-a div是一樣的)是預設引數,這個引數不適用於大的參考序列,必須要小於等於2g。
step 2: 尋找 sa coordinates
如果是 pair-end 資料(read_1.fq和read_2.fq)兩個檔案分別處理
bwa aln reference.fa read_1.fq > read_1.sai
bwa aln reference.fa read_2.fq > read_2.sai
如果是 single 資料(read.fq)
bwa aln reference.fa read.fq > read.sai
如果希望多執行緒執行,在其中加入 -t這個引數,另外-f這個引數可以指定結果輸出檔案,如:
bwa aln -t 3 -f read.sai reference.fa read.fq
主要引數說明:
-o int:允許出現的最大gap數。
-e int:每個gap允許的最大長度。
-d int:不允許在3』端出現大於多少bp的deletion。
-i int:不允許在reads兩端出現大於多少bp的indel。
-l int:read前多少個鹼基作為seed,如果設定的seed大於read長度,將無法繼續,最好設定在25-35,與-k 2 配合使用。
-k int:在seed中的最大編輯距離,使用預設2,與-l配合使用。
-t int:要使用的執行緒數。
-r int:此引數只應用於pair end中,當沒有出現大於此值的最佳比對結果時,將會降低標準再次進行比對。增加這個值可以提高配對比對的準確率,但是同時會消耗更長的時間,預設是32。
-i int:表示輸入的檔案格式為illumina 1.3+資料格式。
-b int:設定標記序列。從5』端開始多少個鹼基作為標記序列,當-b為正值時,在比對之前會將每個read的標記序列剪下,並將此標記序列表示在bc sam 標籤裡,對於pair end資料,兩端的標記序列會被連線。
-b :指定輸入格式為bam格式。
step 3:轉換sa coordinates輸出為sam
如果是pair-end資料
bwa sampe -f pair-end.sam reference.fa read_1.sai read_2.sai read_1.fq read_2.fq
如果是single reads資料
bwa samse -f single.sam reference.fa read.sai read.fq
主要引數說明:
-a int:最大插入片段大小。
-o int:pair end兩reads中其中之一所允許配對的最大次數,超過該次數,將被視為
single end。降低這個引數,可以加快運算速度,對於少於30bp的read,建議降低-o值。
-r str:定義標頭檔案。同single end。
-n int:每對reads輸出到結果中的最多比對數
其他:
fai是對ref基因組檔案建的索引,方便軟體快速隨機讀取基因組序列sai是將fastq比對後出來的檔案,用於最後輸出比對結果sam檔案的
官方文件
使用說明 附註工具使用說明
附註工具使用說明 附註工具用途 附註工具主要用於更新利用word附註應用程式生成的帶域 的附註,該工具在word右鍵 更新鏈結 的基礎上進行了優化,故在使用時,不能再利用word右鍵 更新鏈結 而要用本工具的 更新當前鏈結 或 更新所有鏈結 使用說明 一 更換路徑 當利用word附註應用程式生成帶域...
使用說明 農用遮光網使用說明
農用遮光網使用說明 建築防塵網購買方 建築施工企業 在購買建築防塵網時,應該對 作出比較,可以分辨品牌 型號,且購買時應該在一定程度上了解信譽良莠。建築防塵網購買方 市場售賣方 在選購建築防塵網時,可以把 作為基礎,好的 可以用來彌補信譽不足,而差的 則需要按照你的服務收費。農用遮光網使用說明 用途...
Hibernate tools 使用說明
05年的8月份第一次接觸hibernate tools,使用起來感覺還不錯,但也沒有深入研究,後來由於一直在做乙個專案,再後來用了一陣myeclipse,現在換了公司,使用wtp all in one eclipse的乙個版本 生成domain的時候使用了hibernate tools,發現都不知怎...