repeatmasker是一款專門用於基因組重複序列識別注釋,並分類統計的軟體,幾乎用於所有物種。是研究基因組、非編碼rna、轉座子和著絲粒領等相關領域的必備軟體。很多small rna, lncrna與repeat區有密切關係。
2.6.0 ver 2 2017-3-29
cd ~/bin/
wget
.nlm
.nih
.gov/blast/executables/blast+/2.6
.0/ncbi-blast-2.6
.0+-src.tar
.gzwget
.org/isb-2.6
.0+-changes-vers2.patch
.gztar zxvf ncbi-blast-2.6
.0+-src.tar
.gzgunzip isb-2.6
.0+-changes-vers2.patch
.gzcd ncbi-blast-2.6
.0+-src
patch -p1 < ../isb-2.6
.0+-changes-vers2.patch
cd c++
./configure --with-mt --prefix=/usr/local/rmblast --without-debug
make
# 安裝程式及庫至系統目錄,有報誤,但我們需要的rmblastn已經可以正常使用了
sudo make install # makefile:40: recipe for target 'install-toolkit' failed
# 測試程式是否安裝成功
/usr/local/rmblast/bin/rmblastn -h
4.09 2016-2-22
最新版4.09,本作業系統需要安裝其中的legacy的64位版才能執行
cd ~/bin/
wget
.edu/trf/downloads/trf409.legacylinux64
chmod +x trf409.legacylinux64
sudo cp trf409.legacylinux64 /usr/local/bin/trf
# 測試有幫助資訊即可用
trf
.org/rmdownload.html
4.0.7 2017-2-1
nohup wget -c
.org/repeatmasker-open-4-0-7.tar.gz &bg
tar xvzf repeatmasker-open-4-0-7.tar.gz
mv repbaserepeatmaskeredition-20170127.tar.gz repeatmasker/
cd repeatmasker/
tar xvzf repbaserepeatmaskeredition-20170127.tar.gz
./configure
#新增至全域性環境變數
sudo ln -s `pwd`/repeatmasker /usr/local/bin/repeatmasker
repeatmasker
# 顯示程式詳細幫助手冊
repeatmasker -help
# 擬南芥分析例項
# 進入我存放擬南芥基因組的目錄
cd ~/ref/phytozome/athaliana/tair10/assembly
# 建立結果輸出目錄
mkdir repeat
# 執行程式:parallel是選擇執行緒數; species是物種名,常見物種看幫助,沒有的寫小寫拉丁屬名或引號全名; html和gff是輸出html和gff格式結果,方便檢視和下游分析; dir輸出結果目錄;基因組fa檔案必須放在所有引數最後;用時8min
time repeatmasker -parallel 30 -species arabidopsis -html -gff -dir repeat athaliana_167_tair9.fa
# 短柄草分析例項, 274mb基因組30執行緒用時13min
cd ~/ref/phytozome/bdistachyon/v3.1/assembly
mkdir repeat
time repeatmasker -parallel 30 -species brachypodium -html -gff -dir repeat bdistachyon_314_v3.0.fa
執行開始會顯示資料庫的發布時間版本和物種特異資料資訊,需 注釋核對
( complete database: dc20170127-rb20170127 )
building species libraries in: /mnt/bai/public/bin/repeatmasker/libraries/dc20170127-rb20170127/brachypodium
- 201 ancestral and ubiquitous sequence(s) for brachypodium
- 282 lineage specific sequence(s) for brachypodium
*代表你基因組的名字
1. *.out.gff:重複序列基因組注釋檔案,與基因注釋類似,最重要結果
# 結果預覽
chr1 repeatmasker similarity 1
10713.2 - . target "motif:atrep18"
561649
chr1 repeatmasker similarity 1066
1097
10.0 + . target "motif:(c)n"
132
chr1 repeatmasker similarity 1155
1187
17.1 + . target "motif:(tttctt)n"
133
*.tbl:重複序列注釋結果報告資訊彙總** overview
*.masked: 將注釋為重複序列區的大項替換為n的基因組
*.cat.gz: 序列與重複序列比對的檔案
cd /usr/local
wget
.nlm
.nih
.gov/blast/executables/blast+/2.2
.28/ncbi-blast-2.2
.28+-x64-linux.tar
.gzwget
.nlm
.nih
.gov/blast/executables/rmblast/2.2
.28/ncbi-rmblastn-2.2
.28-x64-linux.tar
.gztar zxvf ncbi-blast-2.2
.28+-x64-linux.tar
.gztar zxvf ncbi-rmblastn-2.2
.28-x64-linux.tar
.gzcp -r ncbi-rmblastn-2.2
.28/* ncbi-blast-2.2.28+/
rm -rf ncbi-rmblastn-2.2.28
mv ncbi-blast-2.2.28+ rmblast-2.2.28
/usr/local/rmblast-2.2.28/bin/rmblastn -h
如果安裝成功了2.2.28,則配置repeatmasker中rmblast位置則改為/usr/local/rmblast-2.2.28/bin/rmblastn
是由於linux legacy glibc的版本相容性問題,故作者提供了兩個版本,原文中的如果不可用,試試下面另乙個版本
wget
.edu/trf/downloads/trf409.linux64
chmod +x trf409.linux64
./trf409.linux64
是repeatmasker檔案中./configure步驟設定錯了,再新再一次,仔細核對每個依賴程式的位置,即可正常執行。
前提是你先執行下相關依賴的程式是否可以執行!
新增了-dir 指定輸出目錄,但沒有結果
time repeatmasker -parallel
30-species arabidopsis -html
-gff
-dir repeat bdistachyon_314_v3.0
.fa
你一定是忘記建立結果資料夾了,程式不會自己建目錄,mkdir repeat是必須的。你有兩個選擇,要麼提前建資料夾,要麼直接不用-dir result引數,把結果全都輸出至當前目錄。 pythonpip安裝與使用 pip安裝與使用
簡介 檢驗pip是否安裝 python3.x版本命令 pip3 version python2.x版本命令 pip version 若尚未安裝,安裝方法 curl o get pip.py 執行安裝指令碼 sudo python get pip.py pip常用命令 顯示版本和路徑 pip vers...
Python Pyinstaller安裝與使用
使用python自帶的pip命令安裝,在命令列輸入以下命令 pip install pyinstaller也可使用命令列 trusted host mirrors.aliyun.com成功之後將看到以下的輸出結果 successfully installed pyinstaller 版本號pyins...
概念與安裝
映象 image 建立docker容器的基礎 容器 container 執行和隔離應用 note 映象本身是唯讀的。容器從映象啟動的時候,會在映象的最上層建立乙個可寫層。倉庫 repository 集中存放映象檔案的場所。每個倉庫存放一類映象,通過標籤 tag 區分 note 倉庫註冊伺服器 存放 ...