使用TEclass對TE一致性序列進行分類

2021-09-29 03:43:58 字數 1552 閱讀 4732

軟體位址在 由於teclass這個軟體已經許久沒有更新了,因此還要講解下安裝步驟。

wget 

tar xf teclass-2.1.3.tar.gz

cd teclass-2.1.3

sh download_dependencies.sh
例如blast

curl -o 'blast.tar.gz'
編譯依賴的軟體

安裝過程

安裝teclass, 這一步可以跳過 repbase的配置。

perl configure.pl

``安裝預編譯的分類器

```bash

wget

mv classifiers.tar.gz classifiers

tar xf classifiers.tar.gz

測試執行

./teclasstest.pl ./testfile.fa
如果是單核處理器,可能要花費數週的時間,所以建議用上你的所有執行緒。

/teclassbuild.pl -x 0  -o new_classifiers -p 99
在repeatmodeler建模後,提取unknown序列使用teclasstest進行歸類,假如輸入檔案命名為modelerunknown.lib

teclasstest modelerunknown.lib
結果在modelerunknown.lib_***x,***x是你執行日期。

modelerunknown.lib # 輸入檔案

modelerunknown.lib.html

modelerunknown.lib.lib # 輸出結果

modelerunknown.lib.stat #結果統計

modelerunknown.lib.lib中的fasta會有分類資訊,如

>rnd-1_family-12#unknown ( repeatscout family size = 705, final multiple alignment size = 88, localized to 114 out of 117 contigs )|teclass result: ltr|forward|orfs: 583..2355:+1
其他引數:

參考文獻: teclass: a tool for automated classification of unknown eukaryotic transposable elements

強一致性 弱一致性 最終一致性

這種方式在es等分布式系統中也有體現,可以設定主shard提交即返回成功,或者需要replica shard提交成功再返回。提到分布式架構就一定繞不開 一致性 問題,而 一致性 其實又包含了資料一致性和事務一致性兩種情況,本文主要討論資料一致性 事務一致性指acid 複製是導致出現資料一致性問題的唯...

一致性分析 壓力均勻性對軟包電池模組一致性影響分析

doi 10.14175 j.issn.1002 4581.2020.01.008 0 引 言 軟包電芯外部只有鋁塑膜封裝,沒有剛性殼體防護,電芯內部極片 隔膜的多孔狀態及介面結構,容易受到外部壓力影響電化學狀態,因此模組成組工藝過程中的約束壓力對軟包電芯效能影響較為顯著。瑞典皇家學院 現代汽車的相...

一致性雜湊

直接貼出一篇介紹的很清楚的博文。關鍵字一致性雜湊 平衡性,單調性,分散性,負載 其實說白了,就是解決把請求分散到不同的機器上運算,怎麼做分散的平均,機器少一台多一台,或者壞掉一台,成很好的自適應和拓展。最簡單的實現分布式演算法,取模嘛,但是它就上述的一些問題,所以不算好的雜湊函式。一致性雜湊演算法,...