正規表示式

什麼是正規表示式：

描述字串排列的一套規則。

基礎知識

1.原子

原子正規表示式中最基本的組成單位，每個正規表示式中至少要包含乙個原子

（1）普通字元作為原子

（2）非列印字元作為原子：字串中用於格式控制的字元如「\n」,「\t」

（3）通用字元作為原子：乙個原子可以匹配一類字元「\w」 ,"\w","\d","\d" ,"\s","\s"

（4）原子表：可以定義一組地位平等的原子，然後匹配的時候回取該原子表中的任意原子進行匹配。[xyz]py,[^xyz]py

2.元字元

正規表示式中具有特殊意義的字元。

(1)任意匹配元字元 : 「.」

(2) 邊界限制元字元：「^」匹配字串的開始，「$」匹配字串的結束

(3)限定符：「*」、「？」、「+」、「」、「」、「」

(4)模式選擇符：「|」

(5)模式單元符：「()」將一些原子組成乙個大原子使用

3.模式修正

4.貪婪模式與懶惰模式

貪婪模式即盡可能多的匹配，懶惰模式即盡可能少的匹配

如想在某些字元間匹配任意字元：「p.*y」預設是貪婪模式，轉化為懶惰模式「p.*?y」

正規表示式常見函式 1

.re.match(pattern,string,flag) 表示從源字串的起始位置匹配乙個模式

2.re.search() 在全文中進行搜尋並匹配

3.全域性匹配函式：將符合模式的內容全部匹配（>=1）出來

思路如下：（1）使用re.compile()對正規表示式進行預編譯

（2）編譯後，使用findall()根據正規表示式從源字串中將匹配的結果全部找出。

4.re.sub(pattern,rep,string,max) 根據正規表示式實現替換某些字串的功能。

正規表示式正規表示式總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數正浮點數正則式英文本串 a za z...

正規表示式表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式編寫正規表示式

為了所有實用化的用途，你可以通過使用程式產生正確的結果。然而，並不意味著程式總是如你所願的那樣正確地工作。多數情況下，如果程式不能產生想要的輸出，可以斷定真正的問題排除輸入或語法錯誤在於如何描述想要的東西。換句話說，應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...

正規表示式

正規表示式 正規表示式 總結

正規表示式 表示式

Linux正規表示式 編寫正規表示式

相關推薦

正規表示式正規表示式總結

正規表示式表示式

Linux正規表示式編寫正規表示式