Annovar 軟體注釋流程

2021-08-03 11:09:28 字數 3033 閱讀 2434

第二步:安裝annovar

linux系統下用該命令解壓

tar zxvf annovar.latest.tar.gz

解壓後生成annovar資料夾,裡面有6個perl指令碼程式和兩個資料夾,其中乙個是example資料夾,另乙個是已經建立好的hg19或者grch37的humandb的資料庫資料夾,可用於人的注釋。

第三步:使用annovar

人的注釋方法,官網介紹的很詳細,但僅僅有人的資料庫肯定是滿足不了大家的需求。

下面以小鼠mm9為例子,介紹如何自己構建乙個mousedb資料庫。

先在annovar資料夾裡面建立mousedb資料夾(名字可自取),命令

mkdir mousedb

然後使用annovar資料夾下的perl程式annotate_variation.pl

perl annotate_variation.pl -downdb -buildver mm9 -webfrom annovar refgene mousedb/

然後程式會提示使用以下兩個命令繼續建庫

annotate_variation.pl --buildver mm9 --downdb seq mousedb/mm9_seq

retrieve_seq_from_fasta.pl mousedb/mm9_refgene.txt -seqdir mousedb/mm9_seq -format refgene -outfile mousedb/mm9_refgenemrna.fa

同樣在annovar檔案下執行這兩個perl程式

perl annotate_variation.pl --buildver mm9 --downdb seq mousedb/mm9_seq

然後繼續執行perl程式

perl retrieve_seq_from_fasta.pl mousedb/mm9_refgene.txt -seqdir mousedb/mm9_seq -format refgene -outfile mousedb/mm9_refgenemrna.fa

該程式會會在mousedb下建立mm9_refgenemrna.fa檔案,是根據mm9_refgene.txt的資訊,重新構建成的老鼠轉錄表達基因fasta格式檔案。

這樣老鼠mm9 annovar gene based注釋庫就弄好了

以文字檔案test.input為案例進行測試

生成test.input的txt格式檔案,根據annovar官網介紹,只要這最基本的五列資訊就可以進行注釋,五列分別染色體名稱,染色體上的位置,染色體上的位置,參考基因組鹼基,變異鹼基。

1       19215217        19215217        t       c

1       33803084        33803084        a       g

1       33803198        33803198        a       g

1       37499237        37499237        t       c

1       37499238        37499238        t       c

1       37500003        37500003        t       c

1       43826936        43826936        t       c

1       58853960        58853960        a       g

1       58854487        58854487        a       g

1       60436865        60436865        t       c

然後使用perl程式進行gene based的注釋

perl annotate_variation.pl -out test -build mm9 test.input mousedb

注釋後會生成test.variant_function,test.exonic_variant_function和test.log檔案,前兩個即為所需要的檔案。用這個例子輸出test.exonic_variant_function檔案輸出為空

檔案,因為這些位點沒有在exonic區域的,所以沒有結果。如果有位點在exonic中,則在test.exonic_variant_function中會更具體的描述為同義突變還是非同義突變

intronic        tfap2b  1       19215217        19215217        t       c

utr3            bag2    1       33803084        33803084        a       g

utr3            bag2    1       33803198        33803198        a       g

utr3           mgat4a  1       37499237        37499237        t       c

utr3           mgat4a  1       37499238        37499238        t       c

utr3           mgat4a  1       37500003        37500003        t       c

intronic        uxs1    1       43826936        43826936        t       c

intronic        casp8   1       58853960        58853960        a       g

intronic        casp8   1       58854487        58854487        a       g

intronic        cyp20a1 1       60436865        60436865        t       c

annovar 軟體注釋流程介紹

(出處: omicshare forum)

軟體流程 開發流程規範

1 prd 介面文件 資料庫文件等按sprint分開整理並同步到confluence 2 前後端分離開發模式下,後端設計介面開發文件,同步到confluence,同時提供mock介面 3 後端功能初步拆分後,由各開發自主評估工期,再由專案leader評審 前端開發人員根據原型圖評估工期 測試人員根據...

軟體測試流程

1 立項 2 需求評審 3 組建測試團隊 4 需求分析 5 測試設計 6 測試計畫 7 測試執行 8 軟體評估 9 測試總結 10 測試維護 測試具體流程依次如下 1.需求 閱讀需求,理解需求,與客戶 開發 架構多方交流,深入了解需求。testing team 2.測試計畫 根據需求估算測試所需資源...

軟體測試流程

1.需求 閱讀需求,理解需求,與客戶 開發 架構多方交流,深入了解需求。testing team 2.測試計畫 根據需求估算測試所需資源 人力 裝置等 所需時間 功能點劃分 如何合理分配安排資源等。testing leader or testing manager 3.用例設計 根據測試計畫 任務分...