1.findall() 方法(返回乙個列表)
**如下:
import re
text = ""
f = open("testtext.txt",'r',encoding="cp936")
for each_line in f:
text = text+each_line
f.close()
#result = re.findall(" ([a-z][a-z][a-z]) ",text) # return list 「」內是需要匹配的內容,這裡a-z指的是所以的英文本母,得到結果加上「()」,返回時,返回的是括號裡的內容。
result = re.findall(" (a[a-z][a-z]) | (a[a-z][a-z]) ",text) #找到文章中所有以a開頭的長度為3個字母的單詞。
setdic1 = set()
for each in result: #並將它們轉換為集合格式
if each[0] not in setdic1:
setdic1.add(each[0])
if each[1] not in setdic1:
setdic1.add(each[1])
result = re.findall("[a-z]+",text)
setdic = set(result) #return set 可以將返回的列表轉換成集合形式。
count = 0
for iteam in setdic:
count = count+1
print(result)
#print(setdic)
#print(count)
#print(text)
python中re庫基礎
正規表示式 基礎使用方法 data re.compile d re.i re.s 建立正規表示式物件 第二個引數代表忽略大小寫以及換行 str data.findall zfc 進行字串匹配 返回是列表形式 re類 正規表示式 萬能匹配 zfc asdkfgjosadjfo1234asdtfgw e...
python中re模組的使用
res re.match pattern,string,flags 0 字串的開頭是否能匹配正規表示式。返回 sre.sre match物件,如果 不能匹配返回none。如果匹配的話,res.string可以獲得原始的字串,並不是匹配的字串 re.sub pattern,repl,string,co...
re庫的使用
如果直接給出字元,就是精確匹配。用 d可以匹配乙個數字,w可以匹配乙個字母或數字 s1 00 d 可以匹配 007 但是匹配不了 00a s2 d d d 可以匹配 010 s3 w w w 可以匹配 py3 s4 s 空格s1 py.pyc pyo py2 符號功能 任意個字元,包括0個 至少乙個...