bwa是乙個針對大型參考基因組(如人類基因組)繪製dna序列的軟體包。它包括三種演算法:bwa-backtrack, bwa-sw和bwa-mem。
假設已經按照了anaconda
conda install bwa
對fasta檔案構建fm-index索引:
bwa index -a bwtsw hg19.fa
有兩種構建index演算法:
-a bwtsw 大的基因組資料,必須大於10mb,比如人的全基因組
-a is 預設的演算法,速度較快,需要較大的記憶體,不能構建大於2gb的資料庫
結果如下
hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、hg19.fasta.sa
對於bwa-backtrack呼叫aln/samse/sampe,
對於bwa-sw呼叫bwasw,
對於bwa-mem演算法呼叫mem。
對於70-100bp illumina讀數,bwa-mem比bwa-backtrack有更好的效能。
所以這裡使用的是men,雙端測序,"@rg\tid:40\tpl:illumina\tlb:wes\tsm:40"描述資訊,加上以免做變異檢測可能出錯
bwa mem -t 4-m
-r"@rg\tid:40\tpl:illumina\tlb:wes\tsm:40" $index $_1.fastq.gz $_2.fastq.gz > $.sam &
我的部落格. bwa軟體的使用
bwa軟體的使用 第一步 建立 index 根據reference genome data e.g.reference.fa 建立 index file root localhost bwa index a bwtsw human hg18 ref.fa human參考基因組18 第二步 尋找 sa...
生信必修課之軟體安裝
一開始我以為很少有人會像我這樣,在乙個沒有任何生信基礎的實驗室搭建生物資訊學分析平台。但是,我慢慢發現其實是有很多人像我這樣子,希望學點生信,從生物這個坑慢慢往外爬。很高興,我的第乙個作品終於能夠和大家見面了,它是國內首個為生信初學者準備的linux軟體安裝的課程,系統性教初學者如何解決軟體安裝這乙...
生信必修課之軟體安裝
課程封面 一開始我以為很少有人會像我這樣,在乙個沒有任何生信基礎的實驗室搭建生物資訊學分析平台。但是,我慢慢發現其實是有很多人像我這樣子,希望學點生信,從生物這個坑慢慢往外爬。很高興,我的第乙個作品終於能夠和大家見面了,它是國內首個為生信初學者準備的linux軟體安裝的課程,系統性教初學者如何解決軟...