python正規表示式

2021-07-31 05:31:40 字數 405 閱讀 3364

最近學爬蟲,需要先學習正規表示式

.號,匹配任意字元,換行符\n除外

*號,匹配前乙個字元0次至無限次

?號,匹配前乙個字元0次或者1次

.*號,貪心演算法,匹配盡可能多(長)的,得到滿足條件最長的

.*?號,飛貪心演算法,匹配盡可能少,得到滿足條件最短的

()號,內部作為返回資料

\d, 匹配純數字

重要,常用,一定要記住:(.*?)

注意,乙個字串的正則輸出結果,相對於字串上的位置,不可能有重疊。

findall 匹配所有符合規律的內容,返回列表

search 匹配第乙個符合規律的內容,返回正規表示式物件(what?)

sub 替換符合規律的內容,返回替換後的值

re.s 可以跳過換行符

python正規表示式元字元 正規表示式

字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

Python 正規表示式

1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...

Python正規表示式

學習python自然而然就不得不面對正規表示式這個難題。當初在沒有學習python之前,自己也曾經嘗試著學習過正規表示式,但是那時候感覺很麻煩,很難懂,結果就是不了了之。但是現在學習python我用的書是 python基礎教程 第二版 這本書中對re模組的講解很簡單易懂,內容不多但起碼把人領進門了,...