因為fasta檔案格式通常為
>name1
atgatagtgtctgtagctgactgt
agtgctgtagatagctagctagtc
>name2
agtcgatcgtagtagctagctagc
agtcgatgctagctagctacgaaa
需要識別每次以'>'開頭的行來區分每段編碼達到處理單條序列的目的,因此需要使用正規表示式來識別每次的名字行
1.規規矩矩的寫法
importrefor line in open("
aa.fasta"):
line = line.strip('\n'
) regex = re.compile('
^>')
m =re.match(regex,line)
if m is
notnone:
print line
輸出為所有開頭為'>'的行
2.可以把regex那行省略
importrefor line in open("
aa.fasta"):
line = line.strip('\n'
) m = re.match('
^>
',line)
if m is
notnone:
print line
3.還可以把m省略
importrefor line in open("
aa.fasta"):
line = line.strip('\n'
)
if re.match('
^>
',line) is
notnone:
print line
以上三種輸出結果相同,都是輸出以'>'開頭的名字那行。
正則匹配開頭和結尾
字元功能 匹配字串開頭 匹配字串結尾 coding utf 8 import re email list xiaowang 163.com xiaowang 163.comheihei com.xiaowang qq.com for email in email list ret re.match ...
python正則 匹配兩個符號開頭和結尾的長字串
使用re正則匹配符號開頭和結尾的長字串 正規表示式是乙個特殊的字串行,它能幫助你方便的檢查乙個字串是否與某種模式匹配。python 自1.5版本起增加了re 模組,它提供 perl 風格的正規表示式模式。re 模組使 python 語言擁有全部的正規表示式功能。compile 函式根據乙個模式字串和...
正則匹配 Python
1.1 0 1 個字元1.2 放在末尾,兩個對等字元之間 對等字元 所有稱得上是括號的字元 左右對稱 所有非括號字元 自對稱 最小對等字元匹配 比如 匹配下文 最小結果只有順帶地,當有多個匹配結果時,m re.search m.group n 返回第n組括號匹配的字元。只需要一組結果時,用m.gro...