正規表示式

\d 可以匹配1個數字

\w 可以匹配1個數字或者字母

\s 可以匹配1個空格或者tab空白符

. 可以匹配1個任意字元

要匹配變長的字元，在正規表示式中，用*表示任意個字元（包括0個），用+表示至少乙個字元，用?表示0個或1個字元，用表示n個字元，用表示n-m個字元

要匹配'010-12345'這樣的號碼，由於'-'是特殊字元，在正規表示式中，要用'\'轉義，表示為 \-

要做更精確地匹配，可以用表示範圍，比如： [0-9a-za-z\_]可以匹配乙個數字、字母或者下劃線； [0-9a-za-z\_]+可以匹配至少由乙個數字、字母或者下劃線組成的字串，比如'a100'，'0_z'，'py3000'等等； [a-za-z\_][0-9a-za-z\_]*可以匹配由字母或下劃線開頭，後接任意個由乙個數字、字母或者下劃線組成的字串，也就是python合法的變數； [a-za-z\_][0-9a-za-z\_]更精確地限制了變數的長度是1-20個字元（前面1個字元+後面最多19個字元）。 a|b可以匹配a或b，所以(p|p)ython可以匹配'python'或者'python'。 ^表示行的開頭，^\d表示必須以數字開頭。 $表示行的結束，\d$表示必須以數字結束。

你可能注意到了，py也可以匹配'python'，但是加上^py$就變成了整行匹配，就只能匹配'py'了。

python提供re模組，包含所有正規表示式的功能。

強烈建議使用python的r字首，就不用考慮\轉義的問題了。

match()方法判斷是否匹配，如果匹配成功，返回乙個match物件，否則返回none。常見的判斷方法就是：

test = '使用者輸入的字串'
if re.match(r'正規表示式', test):
print('ok')
else:
print('failed')

切分字串

用正規表示式切分字串比用固定的字元更靈活，請看正常的切分**：

用str.split()方法

>>> 
'a b   c'.split(' ')
['a', 'b', '', '', 'c']

嗯，無法識別連續的空格，用正規表示式試試：

用re.split(pattern，string,max=0)方法

>>> re.split(r'\s+', 'a b   c')
['a', 'b', 'c']

無論多少個空格都可以正常分割。加入,試試：

>>> re.split(r'[\s\,]+', 'a,b, c  d')
['a', 'b', 'c', 'd']

再加入;試試：

>>> re.split(r'[\s\,\;]+', 'a,b;; c  d')
['a', 'b', 'c', 'd']

正規表示式

正規表示式正規表示式總結

正規表示式表示式

Linux正規表示式編寫正規表示式

正規表示式

正規表示式 正規表示式 總結

正規表示式 表示式

Linux正規表示式 編寫正規表示式

相關推薦

正規表示式正規表示式總結

正規表示式表示式

Linux正規表示式編寫正規表示式