做爬蟲用到幾個re的函式,記錄下來
re.match 嘗試從字串的開始匹配乙個模式。
re.match的函式原型為:re.match(pattern, string, flags)
第乙個引數是正規表示式,這裡為"(\w+)\s",如果匹配成功,則返回乙個match,否則返回乙個none;
第二個引數表示要匹配的字串;
第三個引數是標緻位,用於控制正規表示式的匹配方式,如:是否區分大小寫,多行匹配等等。
re.search函式會在字串內查詢模式匹配,只到找到第乙個匹配然後返回,如果字串沒有匹配,則返回none。
re.search的函式原型為: re.search(pattern, string, flags)
每個引數的含意與re.match一樣。
re.match與re.search的區別:re.match只匹配字串的開始,如果字串開始不符合正規表示式,則匹配失敗,函式返回none;而re.search匹配整個字串,直到找到乙個匹配。
re.findall可以獲取字串中所有匹配的字串。如:re.findall(r'\w*oo\w*', text);獲取字串中,包含'oo'的所有單詞。
python re函式的常用方法
剛學習python的正規表示式我還是有點懵逼的,不過沒關係,慢慢來,看到乙個知識點就吃乙個。re.match arg0,arg1,arg2 span arg0 表示式 arg1 原始字串 arg2 flag即搜尋的標誌符號 其中span 方法是獲取到資料在原字串的位置 re.search arg0,...
python re模組的學習
re模組是用來處理正規表示式的,正規表示式幾乎在每一門語言中都有,用處可謂很大,主要用與搜尋 匹配和替代,向郵箱 手機號碼的匹配,搜尋對應的檔名並進行替換等,下邊稍微羅列一下python常用的re模組中的相關函式,基本符號的使用這裡就不說了 re.match從字串的開頭查詢匹配的字元 re.sear...
Python re模組的常用方法
findall 功能 匹配字串中所有符合條件的 返回值 列表,會將所有匹配到的項加入到列表中返回 import re phone num 17344332233 待匹配的字串 regex r 1 3 9 d 匹配手機號使用的正則 ret re.findall regex,num print ret ...