1.re模組中常用的方法:
re.findall(pattern,str)
該方法可以匹配str中所有符合pattern的子串返回列表型別,如果pattern中有分組則優先顯示分組
ps:一般元字元"|"與分組聯合使用,形如(a|b)
re.search(pattern,str)
該方法可以匹配str中第乙個符合pattern的子串,如果要拿到資料則要呼叫.group()方法
re.match(pattern,str)
該方法可以匹配str中從字串開頭
符合pattern的子串,如果要拿到資料則要呼叫
.group()方法
re.split(pattern,str)
該方法使用pattern對字串進行切分,切分效果和str.split()相同
ret = re.split("\d+"['asdfg', 'zxcvb', 'qwert'], "asdfg2zxcvb56qwert")
print(ret)
ps:如果pattern在組裡也就是re.split((
pattern
),str),那麼也會將組裡的切分字元加入列表:
ret = re.split("(\d+)"['asdfg', '2', 'zxcvb', '56', 'qwert'], "asdfg2zxcvb56qwert")
print(ret)
re.sub(pattern, repl, str, count)
該方法使用pattern對str進行repl進行替換,count指替換次數
re.subn(
pattern, repl, str,count)
該方法使用pattern對str進行repl進行替換,返回元組(new_str,total_repl),第乙個元素是產生的新字串,第二個元素是替換的次數
re.finditer(pattern, str)
該方法使用pattern對str進行匹配,返回迭代器。
re.compile(pattern)
該方法會預編譯pattern,為以後的匹配
提前做準備,加快程式執行效率。
python模組 之 re模組
功能 實現python對正規表示式對支援與應用,將想要得到對內容按照正規表示式匹配出來 應用場景 爬蟲指令碼 對使用者輸入內容進行合規檢查 如qq格式檢查 等 功能 匹配物件中所有符合正規表示式的內容,並取出來 返回值 列表,所匹配到對項都會返回到列表中 import re content 1362...
python內建模組之re模組
在python要想使用正則必須借助於模組,re就是其中之一 查詢字串中所有匹配到的字元,並返回乙個列表,沒有匹配資料則返回乙個空列表 import re re.findall 正規表示式 帶匹配的文字 根據正則匹配除所有符合條件的資料 res re.findall b eva jason jacks...
python學習之re模組
這幾天玩爬蟲已經使用了很多次的re模組,算是比較熟悉了,這裡梳理一下。首先,關於正規表示式的概念,這裡有最好的教程。對於正規表示式,我們可以先用compile方法編譯為pattern物件,再呼叫相關的方法進行模式匹配,也可以直接進行匹配。對於第一種,示例如下 123 4567 8910import ...