BWA使用說明

2021-07-13 14:13:08 字數 1875 閱讀 6422

bwa的使用需要兩個

輸入檔案

:reference genome data 和 

short reads data 

step 1: 建立 index

根據reference genome data 建立 index file

bwa index -a bwtsw reference.fa

構建索引時需要注意的問題:bwa構建索引有三種演算法,三種演算法都是基於bwt的,這三種演算法通過引數-a is 、-a div和-a bwtsw進行選擇。其中-a bwtsw對於短的參考序列是不工作的,必須要大於等於10mb;-a is(效果和-a div是一樣的)是預設引數,這個引數不適用於大的參考序列,必須要小於等於2g。

step 2: 尋找 sa coordinates

如果是 pair-end 資料(read_1.fq和read_2.fq)兩個檔案分別處理

bwa aln reference.fa read_1.fq > read_1.sai

bwa aln reference.fa read_2.fq > read_2.sai

如果是 single 資料(read.fq)

bwa aln reference.fa read.fq > read.sai

如果希望多執行緒執行,在其中加入 -t這個引數,另外-f這個引數可以指定結果輸出檔案,如:

bwa aln  -t 3 -f read.sai reference.fa read.fq

主要引數說明:

-o int:允許出現的最大gap數。

-e int:每個gap允許的最大長度。

-d int:不允許在3』端出現大於多少bp的deletion。

-i int:不允許在reads兩端出現大於多少bp的indel。

-l int:read前多少個鹼基作為seed,如果設定的seed大於read長度,將無法繼續,最好設定在25-35,與-k 2 配合使用。

-k int:在seed中的最大編輯距離,使用預設2,與-l配合使用。

-t int:要使用的執行緒數。

-r int:此引數只應用於pair end中,當沒有出現大於此值的最佳比對結果時,將會降低標準再次進行比對。增加這個值可以提高配對比對的準確率,但是同時會消耗更長的時間,預設是32。

-i int:表示輸入的檔案格式為illumina 1.3+資料格式。

-b int:設定標記序列。從5』端開始多少個鹼基作為標記序列,當-b為正值時,在比對之前會將每個read的標記序列剪下,並將此標記序列表示在bc sam 標籤裡,對於pair end資料,兩端的標記序列會被連線。

-b :指定輸入格式為bam格式。

step 3:轉換sa coordinates輸出為sam

如果是pair-end資料

bwa sampe -f pair-end.sam reference.fa read_1.sai read_2.sai read_1.fq read_2.fq

如果是single reads資料

bwa samse -f single.sam reference.fa read.sai read.fq

主要引數說明:

-a int:最大插入片段大小。

-o int:pair end兩reads中其中之一所允許配對的最大次數,超過該次數,將被視為

single end。降低這個引數,可以加快運算速度,對於少於30bp的read,建議降低-o值。

-r str:定義標頭檔案。同single end。

-n int:每對reads輸出到結果中的最多比對數

其他:

fai是對ref基因組檔案建的索引,方便軟體快速隨機讀取基因組序列

sai是將fastq比對後出來的檔案,用於最後輸出比對結果sam檔案的

官方文件

使用說明 附註工具使用說明

附註工具使用說明 附註工具用途 附註工具主要用於更新利用word附註應用程式生成的帶域 的附註,該工具在word右鍵 更新鏈結 的基礎上進行了優化,故在使用時,不能再利用word右鍵 更新鏈結 而要用本工具的 更新當前鏈結 或 更新所有鏈結 使用說明 一 更換路徑 當利用word附註應用程式生成帶域...

使用說明 農用遮光網使用說明

農用遮光網使用說明 建築防塵網購買方 建築施工企業 在購買建築防塵網時,應該對 作出比較,可以分辨品牌 型號,且購買時應該在一定程度上了解信譽良莠。建築防塵網購買方 市場售賣方 在選購建築防塵網時,可以把 作為基礎,好的 可以用來彌補信譽不足,而差的 則需要按照你的服務收費。農用遮光網使用說明 用途...

Hibernate tools 使用說明

05年的8月份第一次接觸hibernate tools,使用起來感覺還不錯,但也沒有深入研究,後來由於一直在做乙個專案,再後來用了一陣myeclipse,現在換了公司,使用wtp all in one eclipse的乙個版本 生成domain的時候使用了hibernate tools,發現都不知怎...