字元組: 寫再括號中的內容,若出現,都可以被匹配到。
[0-9] 匹配數字
[a-z] 匹配小寫字母
[a-z] 匹配大寫字母
[a-za-z] 匹配所有的大寫和小寫的字母
[a-za-z0-9] 匹配所有的大寫和小寫的字母和數字
[a-za-z0-9_] 匹配所有的大寫和小寫的字母和數字和下劃線
[0-9a-fa-f] 可以匹配水族,大小寫形式的a~f,用來驗證十六進製制字元
元字元:
\w 匹配數字字母下劃線 [a-za-z0-9_]
\d 匹配數字 [0-9]
\s 匹配所有的空白符 包括:換行符(回車)、製表符(tab)、空格
\t 匹配製表符(tab)
\n 匹配換行符(回車)
空格匹配空格~
\w 匹配非數字字母下劃線和\w取反
\d 匹配非數字和\d取反
\s 匹配非空白符和\s取反
[\s\s] [\w\w] [\d\d] 是三組全集 匹配所有字元
\b 表示單詞的邊界(開頭或者結尾)
匹配所有ing結尾的單詞的邊界
匹配所有以l開頭的單詞的邊界
^ 匹配乙個字串的開始
$ 匹配乙個字串的結束
. ''點''表示匹配除了換行符之外的所有字元
只有出現在中括號中的內容都可以被匹配
有一些有特殊意義的元字元進入字元組中回回覆它本來的意義:.、|、 [、 ]、(、 )、
[^] 匹配除了中括號中的所有內容
| 或
復合a規則或者b規則的都可以被匹配
如果a規則是b規則的一部分,且a規則比b規則要苛刻\長,就把a規則寫在前面,將更複雜的\更長的規則寫在最前面。
() 分組 表示給幾個字元加上量詞約束需求的時候,就給這些量詞分在乙個組。
量詞: 表示這個量詞之前的字元出現n次,且只能出現n次。
表示這個量詞之前的字元至少出現n次。
表示這個量詞之前的字元出現n到m次。
? 表示匹配這個量詞之前的字元出現0次或者1次。當表示某個字元可有可無時。
+ 表示匹配量詞之前的字元出現1次或者多次。
* 表示匹配量詞之前的字元出現0次或者多次。
非貪婪匹配:
.*?x 匹配任意非換行字元任意次,知道遇到x就停止。
python正規表示式元字元 正規表示式
字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...
Python 正規表示式
1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...
Python正規表示式
學習python自然而然就不得不面對正規表示式這個難題。當初在沒有學習python之前,自己也曾經嘗試著學習過正規表示式,但是那時候感覺很麻煩,很難懂,結果就是不了了之。但是現在學習python我用的書是 python基礎教程 第二版 這本書中對re模組的講解很簡單易懂,內容不多但起碼把人領進門了,...