python 正規表示式

正規表示式（re）是一種小型的、高度專業化的程式設計序語言，它內嵌在python中，並通過re模組實現

它可以為想要匹配的相應字串集指定規則

該字串集可以包含英文語句、e-mail位址、命令或任何你想要搞定的東西

可以使用re以各種方式來修改或分割字串

[ ]

>>> 
import re
>>> s = r'abc'
>>> re.findall(s,"aaabcadfdffdsfscbabcccba")
['abc', 'abc']
>>> re.findall(r"a[bc]c","abcaccaacv")
['abc', 'acc']

^ 匹配行首

查詢開頭是否有某個規則的字串

$ 匹配行尾

>>> s = "hello hello2"
>>> r = r'hello'
>>> re.findall(r,s)
['hello', 'hello']
>>> r = r'^hello'
>>> re.findall(r,s)
['hello']
>>> r = r'^hello2'
>>> re.findall(r,s)
>>> r = r'hello2$'
>>> re.findall(r,s)
['hello2']

>>> s = "abacada^aea$af"
>>> r = r'a[bcf^d]'
>>> re.findall(r,s)
['ab', 'ac', 'ad', 'a^', 'af']
>>> r = r'a[^bcd]'
>>> re.findall(r,s)
['a^', 'ae', 'a$', 'af']
>>> r = r'a[f$]'
>>> re.findall(r,s)
['a$', 'af']
>>> r = r'af$'
>>> re.findall(r,s)
['af']

[ ]的簡寫形式

>>> r = r'[0-9]'
>>> r = r'[a-z]'
>>> r = r'[a-z]'

指定前乙個字元可以被匹配零次或多次，而不是只有一次。匹配引擎會嘗試這重複盡可能多得次數。

>>> r = r'ab*'
>>> re.findall(r,'a')
['a']
>>> re.findall(r,'ab')
['ab']
>>> re.findall(r,'abbbbb')
['abbbbb']

>>> r = r'010-\d'
>>> s = '010-12345678'
>>> re.findall(r,s)
['010-12345678']

編譯正規表示式

為什麼要進行編譯呢？因為之前的正規表示式如果使用率較高，那麼編譯之後用起來速度更快。compile()

>>> r = r'010-\d'
>>> s = '010-12345678'
>>> p = re.compile(r)
>>> p.findall(s)
['010-12345678']

編譯的過程中，可以加一些屬性，讓它更靈活。比如，不區分大小寫的匹配：

>>> csvt_re = re.compile(r"csvt",re.i)
>>> csvt_re.findall("csvt")
['csvt']
>>> csvt_re.findall("csvt")
['csvt']

反斜槓的麻煩

字串前加「r」反斜槓就不會被任何特殊方式處理。

python正規表示式元字元正規表示式

字元描述將下乙個字元標記為乙個特殊字元或乙個原義字元或乙個向後引用或乙個八進位制轉義符。例如，n 匹配字元 n n 匹配乙個換行符。序列匹配而則匹配匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性，也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

Python 正規表示式

1.在python中，所有和正規表示式相關的功能都包含在re模組中。2.字元表示字串的末尾如 road 則表示只有當 road 出現在乙個字串的尾部時才會匹配。3.字元表示字元中的開始如 road 則表示只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...

Python正規表示式

學習python自然而然就不得不面對正規表示式這個難題。當初在沒有學習python之前，自己也曾經嘗試著學習過正規表示式，但是那時候感覺很麻煩，很難懂，結果就是不了了之。但是現在學習python我用的書是 python基礎教程第二版這本書中對re模組的講解很簡單易懂，內容不多但起碼把人領進門了，...

python 正規表示式

python正規表示式元字元 正規表示式

Python 正規表示式

Python正規表示式

相關推薦

python正規表示式元字元正規表示式