python中的正規表示式

1. 精確匹配，如果直接給出字元，就是精確匹配。

（1）\d可以匹配乙個數字；

（2）\w可以匹配乙個字母或數字；

（3）.點符號可以匹配任意字元；

（4）*星符號表示任意個字元；

（5）用+表示至少乙個字元；

（6）用?表示0個或1個字元；

（7）用表示n個字元；

（8）用表示n-m個字元；

（9）\s可以匹配乙個空格（也包括tab等空白符；

（10）由於'-'是特殊字元，在正規表示式中，要用'\'轉義；

（11）用表示範圍；

（12）a|b可以匹配a或b；

（13）^表示行的開頭，^\d表示必須以數字開頭；

（14）$表示行的結束，\d$表示必須以數字結束。

2. 綜合舉例

3. re模組

match()方法判斷是否匹配，如果匹配成功，返回乙個match物件，否則返回none.

4. 切分字串

re.split(r'\s+', 'a b c d')

5. 分組

用()表示的就是要提取的分組（group），group(0)永遠是原始字串，group(1)、group(2)……表示第1、2、……個子串。

6. 貪婪匹配

正則匹配預設是貪婪匹配，也就是匹配盡可能多的字元。加個?就可以讓\d+採用非貪婪匹配。

7. 編譯

編譯正規表示式，如果正規表示式的字串本身不合法，會報錯；用編譯後的正規表示式去匹配字串。

python中的正規表示式

正規表示式是一種用來匹配字串的強有力的它的設計思想是用一種描述性的語言來給字串定義乙個規則，凡是符合規則的字串，我們就認為它匹配了，否則，該字串就是不合法的。因為正規表示式也是用字串表示的，所以，我們要首先了解如何用字元來描述字元。在正規表示式中，如果直接給出字元，就是精確匹配。用 d可以匹配...

Python中的正規表示式

在使用python製作爬蟲之前，我們必須要對python的正規表示式有一定的了解,在python中使用正規表示式要匯入re包 d匹配數字1 9 w匹配字元匹配集合裡面的字元匹配前面出現的正規表示式1次或多次表示匹配任意乙個字元，除換行符除外，x.匹配xy23中的xy,若是x.則匹配出xy2 表...

Python中的正規表示式

對應 abc 001 s r abc 001 加r字首，就不用考慮轉義的問題了。print re.match d d 010 12345 匹配成功返回乙個match物件，否則返回none.re.match 的常見寫法 test 輸入字串 if re.match 正規表示式 test print ok...

python中的正規表示式

python中的正規表示式

Python中的正規表示式

Python中的正規表示式

相關推薦