沒有深入研究,只想對多序列做個比對,然後分組,具體命令如下:
1、多序列比對(資料量不大,曾經用了乙個挺大的,直接吐核,放棄了,網上有說多執行緒操作,沒有用,照例吐)
muscle -in seqs.fa -out seqs.afa
對於大資料集可以使用(我用了,直接報錯,不知道咋回事,希望能有成功的寶寶)
muscle -in seqs.fa -out seqs.afa -maxiters 2
2、序列轉變為clustalw格式
muscle -in seq.afa -clw -out seq.clw
因為clw檔案是分段顯示的,我用python做了合併,輸出整體序列比對結果(很不幸,這次比對不太好,我大概要棄了muscle,試下cd-hit,實在不行還得後續想辦法,哭泣。。。)
import json
dict={}
with open('seq.clw','r')as js:
for line in js.readlines():
print(line)
if line.isspace():
continue
else:
s=line.split( )
print(s)
if s[0] in dict.keys():
dict[s[0]]=dict[s[0]]+s[1]
else:
dic=
dict.update(dic)
js.close()
filew=open('catclw.clw','w')
for key in dict.keys():
filew.write(key+" "+dict[key]+"\n")
filew.close()
3、根據多重比對結果構建upgma樹
muscle -maketree -in seqs.afa -out seqs.phy
Muscle 進行多序列比對
muscle 進行多序列比對 軟體的主頁是 進入主頁,簡單看看軟體介紹,這個軟體還是蠻牛的,乙個人在家裡自己寫出來的,當然,對於普通人來說,這個軟體跟clustalw沒什麼區別,反正都是多序列比對啦!準備資料,我這裡選擇的是幾個短小的蛋白 這裡有兩種比對方式,都是很簡單的命令 一種是先比對,再生成樹...
mVISTA 多序列比對葉綠體基因組
mvista可對2個或者多個dna序列進行比較,可以對比對結果進行視覺化。詳情請大力戳這裡 mvista 需要輸入的檔案有如下幾類 必須檔案 可選檔案 106481 116661 gene1 106481 106497 utr 107983 108069 exon 109884 110033 exo...
多序列比對要多久時間 古箏基本功學習要多久的時間?
古箏基本功學習時間學古箏的過程是乙個艱苦的過程,不是一朝一夕就能完成的,有的人學箏,乙個星期就能學一首曲子,隔著許多曲子蹭蹭往上跳,再甩掉一些不學的,幾年就把古箏學完了,這不好。學箏過程中要學好一首再去學另一首,而不要學的拌拌磕磕就換下一首學。要高標準 嚴要求,有曲不驚人誓不休的精神,不要去過多的追...