1. re.compile(pattern[,flags]):根據包含正規表示式的字串建立模式物件。
2. re.findall(pattern,string):列出所有匹配項。返回乙個列表。
3. re.sarch(pattern,string[,flags]):只尋找出第乙個匹配項。
4. re.match(pattern,string[,flags]):只在字串的開頭處匹配,只匹配第乙個匹配項。
5. re.split(pattern,string[,maxsplit=0]:用於分割字串。
6. re.sub(pat, repl, string[,count=0]):將字串中所有pat的匹配項用repl替換。
7. re.escape(string):將字串中所有特殊正規表示式字元進行轉義。
通過re模組中的函式,當找到匹配項時,會返回乙個matchobject物件,可以對這些物件應用一些方法。
1. group():在正則中一對括號代表一組,組的序號取決於它左側的括號數量。組0就是整個模式。
例:『there (was a (wee)(cooper)) who (lived in fyfe)'
包含下面這些組:
0 there was a wee cooper who lived in fyfe
1 was a wee cooper
2 wee
3 cooper
4 lived in fyfe
例2:>>>m = re.match(r"(..)+", "a1b2c3")
>>>m.group(1)
'c3'
這裡只有乙個括號,所以是乙個group....這個group匹配了3次,乙個group的每一次匹配覆蓋上一次的匹配結果。
2. start([group]):返回給定組匹配項的開始索引
3. end([group]):返回給定組匹配項的結束索引加+1
4. span([group]):以元組的形式返回開始和結束索引。
*?,+?,??,? 前面的*,+,?等都是貪婪匹配,也就是盡可能匹配,後面加?號使其變成惰性匹配。
學習筆記 re庫入門
操作符 說明例項 單個字元 字符集 abc 表示a或b或c a z 表示a到z間到乙個字元 非字符集 abc 非a或b或c的單個字元 前乙個字元0次或無限次擴充套件 abc 表示ab,abc,abcc,abccc等 前乙個字元1次或無限次擴充套件 abc 表示abc,abcc,abccc等 前乙個字...
python學習之re庫
正規表示式庫re是非常重要的乙個庫。首先正規表示式有兩種表示型別,一種是raw string型別 原生字串型別 也就是我們經常看到的r 的寫法,另一種是不帶r的寫法,稱為string型別。raw string的作用是把轉義字元當做普通的字元,所以一般來說,我們都是使用raw string型別,這樣會...
python爬蟲學習筆記五 Re庫的介紹和使用
re庫是python的標準庫,主要用於字串匹配。呼叫方式 import re raw string 型別 原生字串型別 re庫採用raw string型別表示正規表示式,表示為 r text 例如 r 1 9 d r d d d d raw string是不包含轉義符的字串 string型別,更繁瑣...