生信軟體之bwa

2021-10-08 22:07:54 字數 824 閱讀 6488

bwa是乙個針對大型參考基因組(如人類基因組)繪製dna序列的軟體包。它包括三種演算法:bwa-backtrack, bwa-sw和bwa-mem。

假設已經按照了anaconda

conda install bwa
對fasta檔案構建fm-index索引:

bwa index -a bwtsw hg19.fa
有兩種構建index演算法:

-a bwtsw 大的基因組資料,必須大於10mb,比如人的全基因組

-a is 預設的演算法,速度較快,需要較大的記憶體,不能構建大於2gb的資料庫

結果如下

hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、hg19.fasta.sa

對於bwa-backtrack呼叫aln/samse/sampe,

對於bwa-sw呼叫bwasw,

對於bwa-mem演算法呼叫mem。

對於70-100bp illumina讀數,bwa-mem比bwa-backtrack有更好的效能。

所以這裡使用的是men,雙端測序,"@rg\tid:40\tpl:illumina\tlb:wes\tsm:40"描述資訊,加上以免做變異檢測可能出錯

bwa mem -t 4-m

-r"@rg\tid:40\tpl:illumina\tlb:wes\tsm:40" $index $_1.fastq.gz $_2.fastq.gz > $.sam &

我的部落格.

bwa軟體的使用

bwa軟體的使用 第一步 建立 index 根據reference genome data e.g.reference.fa 建立 index file root localhost bwa index a bwtsw human hg18 ref.fa human參考基因組18 第二步 尋找 sa...

生信必修課之軟體安裝

一開始我以為很少有人會像我這樣,在乙個沒有任何生信基礎的實驗室搭建生物資訊學分析平台。但是,我慢慢發現其實是有很多人像我這樣子,希望學點生信,從生物這個坑慢慢往外爬。很高興,我的第乙個作品終於能夠和大家見面了,它是國內首個為生信初學者準備的linux軟體安裝的課程,系統性教初學者如何解決軟體安裝這乙...

生信必修課之軟體安裝

課程封面 一開始我以為很少有人會像我這樣,在乙個沒有任何生信基礎的實驗室搭建生物資訊學分析平台。但是,我慢慢發現其實是有很多人像我這樣子,希望學點生信,從生物這個坑慢慢往外爬。很高興,我的第乙個作品終於能夠和大家見面了,它是國內首個為生信初學者準備的linux軟體安裝的課程,系統性教初學者如何解決軟...