python 中 re 模組提供了正規表示式的全部功能,此處記錄了一些我用到的函式。
re.match 從字串起始位置匹配,如果沒有匹配上,則返回none。相當於給正規表示式 加上了 ^。
# nonere.search 函式掃瞄整個字串,返回第乙個成功的匹配
))re.match 只匹配字串開頭,不匹配返回 none。re.search 掃瞄整個字串,返回第乙個匹配。
re.sub 用於替換字串中的匹配項
re.sub(pattern, repl, string, count=0, flag=0)
import re
phone =
187-
1234
-5678
# 這是乙個號碼
num = re.sub(r'#.*$',''
, phone)
注意r 表示字串為非轉義的原始字串,讓編譯器忽略反斜槓,也就是忽略轉義字元。
re.compile 用於編譯正規表示式,生成乙個正規表示式物件(pattern),供re.match() 和re.search() 兩個函式使用。
re.compile(pattern, flag=0)
re.findall 在字串中找出正規表示式匹配的所有字串,並返回乙個列表。沒有,則返回空列表。
注意match 和 search 只匹配一次,findall 匹配所有。
re.findall(pattern, string, flag=0)
re.finditer 與 findall 類似,但是結果作為乙個迭代器返回。
re.finditer(pattern, sting, flag=0)
修飾符
描述re.i
使匹配對大小寫不敏感
re.l
做本地化識別(locale-aware)匹配
re.m
多行匹配,影響 ^ 和 $
re.s
使 . 匹配包括換行在內的所有字元
re.u
根據unicode字符集解析字元。這個標誌影響 \w, \w, \b, \b
re.u
該標誌通過給予你更靈活的格式以便你將正規表示式寫得更易於理解
python正規表示式元字元 正規表示式
字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...
Python 正規表示式
1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...
Python正規表示式
學習python自然而然就不得不面對正規表示式這個難題。當初在沒有學習python之前,自己也曾經嘗試著學習過正規表示式,但是那時候感覺很麻煩,很難懂,結果就是不了了之。但是現在學習python我用的書是 python基礎教程 第二版 這本書中對re模組的講解很簡單易懂,內容不多但起碼把人領進門了,...