python爬蟲之re模組

2021-10-05 06:55:44 字數 1745 閱讀 1740

傳送門python爬蟲之正規表示式

match:從開始的位置進行匹配。如果開始的位置沒有匹配到。就直接失敗了。

text =

"hello"

ret = re.match(

"h",text)

print

(ret.group(

))

在字串中找到第乙個滿足條件的。

text =

"hello"

ret = re.search(

"e",text)

print

(ret.group(

))

在正規表示式中,可以對過濾到的字串進行分組。分組使用圓括號的方式。

group:和group(0)是等價的,返回的是整個滿足條件的字串。

groups:返回的匹配分組的tuple。索引從1開始。

group(1):返回的是第乙個子組,可以傳入多個

text =

ret = re.search(r".*(\$\d+).*(\$\d+)"

,text)

print

(ret.group())

print

(ret.group(0)

)print

(ret.group(1)

)print

(ret.group(2)

)print

(ret.groups())

print

(type

(ret.groups())

)

執行結果如下

找出所有滿足條件的,返回的是乙個列表

text =

ret = re.findall(

"\d."

,text)

print

(ret)

執行結果如下

用來替換字串。將匹配到的字串替換為其他字串

text =

ret = re.sub(

'\d+'

,'100'

,text)

print

(ret)

執行結果

使用正規表示式來分割字串

text =

"hello world ni hao"

ret = re.split(

'\w'

,text)

print

(ret)

執行結果

對於一些經常要用到的正規表示式,可以使用compile進行編譯,後期再使用的時候可以直接拿過來用,執行效率會更快

text =

"the number is 20.50"

r = re.

compile

(r"""

\d+ # 小數點前面的數字

\.? # 小數點

\d* # 小數點後面的數字

""",re.verbose)

ret = re.search(r,text)

print

(ret.group(

))

執行結果如下

python模組 之 re模組

功能 實現python對正規表示式對支援與應用,將想要得到對內容按照正規表示式匹配出來 應用場景 爬蟲指令碼 對使用者輸入內容進行合規檢查 如qq格式檢查 等 功能 匹配物件中所有符合正規表示式的內容,並取出來 返回值 列表,所匹配到對項都會返回到列表中 import re content 1362...

python內建模組之re模組

在python要想使用正則必須借助於模組,re就是其中之一 查詢字串中所有匹配到的字元,並返回乙個列表,沒有匹配資料則返回乙個空列表 import re re.findall 正規表示式 帶匹配的文字 根據正則匹配除所有符合條件的資料 res re.findall b eva jason jacks...

python學習之re模組

這幾天玩爬蟲已經使用了很多次的re模組,算是比較熟悉了,這裡梳理一下。首先,關於正規表示式的概念,這裡有最好的教程。對於正規表示式,我們可以先用compile方法編譯為pattern物件,再呼叫相關的方法進行模式匹配,也可以直接進行匹配。對於第一種,示例如下 123 4567 8910import ...