StringTie在注釋基因組時的注意事項

2021-09-29 03:43:58 字數 430 閱讀 6649

在利用rna-seq注釋基因組時,有乙個問題就是,我將不同組織**的轉錄組資料和參考基因組比對之後,那下一步是1)先將這三個比對結果進行合併,然後用stringtie進行**,還是2)用stringtie分別進行**,然後用stringtie的merge模式進行合併?

這個問題的提出,是我採取第二種方式時,發現合併後的基因數減少,覺得**不太對勁,於是用i**檢查了不同分析策略的結果,

結論如下:

stringtie 的merge模式能夠合併不同的**的結果,但在合併的同時會根據fpkm,tpm和轉錄本長度過濾,最終結果可以認為是在所有樣本裡面都是有所表達的基因,因此最終的數目會少一些。同時由於某些基因表達量低,單個樣本裡由於read數少無法覆蓋基因,因此最終的**結構還完整。

因此,需要先將bam合併後,然後進行**,如果為了輸出結果的可靠性,還可以根據fpkm和tpm做過濾。

線粒體和葉綠體的基因組特點 基因和基因組

基因 gene 是能夠編碼蛋白質或者rna等具有特定功能產物的 負載遺傳資訊的基本單位,即有遺傳效應的dn 段 可以理解為 gene protein rna mrna trna rrna 基因組 genome 是指乙個生物體內所有遺傳物質的總和,對於含有線粒體或者葉綠體等結構的生物來說,還包括其中的...

人基因組(一)

人類基因組包含22條染色體和1條x或者y染色體,這些染色體長度為45 279mb,加起來共為3286mb。基於染色體的結構,全部基因可被分為常染色質 euchromatin 區域 通常包含活性基因 和異質染色質 heterochromatin 區域,後者攜帶低密度的活性基因。常染色質組成了基因組的主...

比較基因組學

以 全基因組 測序為目標的 結構基因組學 structural genomics 以 基因功能鑑定 為目標的 功能基因組學 functional genomics 又被稱為後基因組 postgenome 比較基因組學 comparative genomics 是基於基因 譜和測序基礎上,對已知的基因...