python庫學習筆記(re庫)

2022-07-16 22:27:27 字數 1213 閱讀 3607

1.  re.compile(pattern[,flags]):根據包含正規表示式的字串建立模式物件。

2.  re.findall(pattern,string):列出所有匹配項。返回乙個列表。

3.  re.sarch(pattern,string[,flags]):只尋找出第乙個匹配項。

4.  re.match(pattern,string[,flags]):只在字串的開頭處匹配,只匹配第乙個匹配項。

5.  re.split(pattern,string[,maxsplit=0]:用於分割字串。

6.  re.sub(pat, repl, string[,count=0]):將字串中所有pat的匹配項用repl替換。

7.  re.escape(string):將字串中所有特殊正規表示式字元進行轉義。

通過re模組中的函式,當找到匹配項時,會返回乙個matchobject物件,可以對這些物件應用一些方法。

1.  group():在正則中一對括號代表一組,組的序號取決於它左側的括號數量。組0就是整個模式。

例:『there (was a (wee)(cooper)) who (lived in fyfe)'

包含下面這些組:

0 there was a wee cooper who lived in fyfe

1 was a wee cooper

2 wee

3 cooper

4 lived in fyfe

例2:>>>m = re.match(r"(..)+", "a1b2c3") 

>>>m.group(1) 

'c3' 

這裡只有乙個括號,所以是乙個group....這個group匹配了3次,乙個group的每一次匹配覆蓋上一次的匹配結果。

2.  start([group]):返回給定組匹配項的開始索引

3.  end([group]):返回給定組匹配項的結束索引加+1

4.  span([group]):以元組的形式返回開始和結束索引。

*?,+?,??,?    前面的*,+,?等都是貪婪匹配,也就是盡可能匹配,後面加?號使其變成惰性匹配。

學習筆記 re庫入門

操作符 說明例項 單個字元 字符集 abc 表示a或b或c a z 表示a到z間到乙個字元 非字符集 abc 非a或b或c的單個字元 前乙個字元0次或無限次擴充套件 abc 表示ab,abc,abcc,abccc等 前乙個字元1次或無限次擴充套件 abc 表示abc,abcc,abccc等 前乙個字...

python學習之re庫

正規表示式庫re是非常重要的乙個庫。首先正規表示式有兩種表示型別,一種是raw string型別 原生字串型別 也就是我們經常看到的r 的寫法,另一種是不帶r的寫法,稱為string型別。raw string的作用是把轉義字元當做普通的字元,所以一般來說,我們都是使用raw string型別,這樣會...

python爬蟲學習筆記五 Re庫的介紹和使用

re庫是python的標準庫,主要用於字串匹配。呼叫方式 import re raw string 型別 原生字串型別 re庫採用raw string型別表示正規表示式,表示為 r text 例如 r 1 9 d r d d d d raw string是不包含轉義符的字串 string型別,更繁瑣...