1. 精確匹配,如果直接給出字元,就是精確匹配。
(1)\d
可以匹配乙個數字;
(2)\w
可以匹配乙個字母或數字;
(3).點符號可以匹配任意字元;
(4)*星符號表示任意個字元;
(5)用+
表示至少乙個字元;
(6)用?
表示0個或1個字元;
(7)用表示n個字元;
(8)用表示n-m個字元;
(9)\s
可以匹配乙個空格(也包括tab等空白符;
(10)由於'-'
是特殊字元,在正規表示式中,要用'\'
轉義;
(11)用表示範圍;
(12)a|b
可以匹配a或b;
(13)^
表示行的開頭,^\d
表示必須以數字開頭;
(14)$
表示行的結束,\d$
表示必須以數字結束。
2. 綜合舉例
3. re模組
match()
方法判斷是否匹配,如果匹配成功,返回乙個match
物件,否則返回none.
4. 切分字串
re.split(r'\s+', 'a b c d')
5. 分組
用()
表示的就是要提取的分組(group),group(0)
永遠是原始字串,group(1)
、group(2)
……表示第1、2、……個子串。
6. 貪婪匹配
正則匹配預設是貪婪匹配,也就是匹配盡可能多的字元。加個?
就可以讓\d+
採用非貪婪匹配。
7. 編譯
編譯正規表示式,如果正規表示式的字串本身不合法,會報錯;用編譯後的正規表示式去匹配字串。
python中的正規表示式
正規表示式是一種用來匹配字串的強有力的 它的設計思想是用一種描述性的語言來給字串定義乙個規則,凡是符合規則的字串,我們就認為它 匹配 了,否則,該字串就是不合法的。因為正規表示式也是用字串表示的,所以,我們要首先了解如何用字元來描述字元。在正規表示式中,如果直接給出字元,就是精確匹配。用 d可以匹配...
Python中的正規表示式
在使用python製作爬蟲之前,我們必須要對python的正規表示式有一定的了解,在python中使用正規表示式要匯入re包 d匹配數字1 9 w匹配字元 匹配集合裡面的字元 匹配前面出現的正規表示式1次或多次 表示匹配任意乙個字元,除換行符除外,x.匹配xy23中的xy,若是x.則匹配出xy2 表...
Python中的正規表示式
對應 abc 001 s r abc 001 加r字首,就不用考慮轉義的問題了。print re.match d d 010 12345 匹配成功返回乙個match物件,否則返回none.re.match 的常見寫法 test 輸入字串 if re.match 正規表示式 test print ok...