這是個genebank的序列檔案
這個檔案需要轉換成fasta格式的檔案,指令碼如下:
import re
output = open("data3.txt","w")
with
open("sequence.gb","r") as f:
read = f.readlines()
title = read[0]
title = ">"+title[12:20]
print(title)
output.write(title)
output.write("\n")
seq = read[81:138]
seq_complete =
for i in seq:
for e in i:
if re.match("[a-z]",e):
seq_complete = "".join(seq_complete)
#print(seq_complete)
output.write(seq_complete)
output.close()
我寫的這個只對某乙個gb檔案有效,因為我數了一下序列的行數,然後切片取的,其實還有完全使用正則的更好的方法。
import re
f=open('sequence.gb','r')
seq=""
forline
in f:
if re.search('accession',line):
m=line.split('accession')[1].strip()
if re.search('organism',line):
n=line.split('organism')[1].strip()
print ('> %s : %s' % (n,m))
if re.search('[0-9] [a-z]',line):
s=re.split('[0-9] ',line)[1]
print (s.split(" "))
for i in s.split(" "):
seq=seq.rstrip()+i.rstrip()
不錯吧! 什麼是3G和3G手機
科技新名詞 什麼是3g 和3g手機 3g,全稱為3rdgeneration,中文含義就是指第三代數字通訊 相對第一代模擬制式手機 1g 和第二代g td ma等數字手機 2g 3g通訊 的名稱繁多,國際電聯規定為 imt 2000 國際移動 2000 標準,歐洲的電信業巨頭們則稱其為 umts 通用...
SDP消弭 3G資訊服務短板
隨著移動通訊網路由2g向3g演進,網路頻寬極大改善,業務提供者與終端間的 天塹 將變 通途 電信 運營商的角色作用可能快速被削弱。在這一背景之下,運營商需要做的是盡快成為業務提供者與終端之間渠道的掌控者,重新建立起自己的獨特作用,sdp正是要幫助運營商實現這一角色變換。運營商3g短板催生sdp 目前...
MID 為3G而生,因3G引爆流行
一直以來非常關注mid 多 網際網路終端 的進展,也已經使用過幾款不同公司的mid產品,直到最近用過瑞芯微開發中的mid產品,感到mid盛行時代真的越來越近。2009年無論業界都將上網本作為3g助推劑,可惜從市場的表現來看,消費者並不買賬,雖然運營商給與大量補貼,上網本依然難逃厄運,至少在中國如此,...