正規表示式

2021-08-10 15:38:58 字數 930 閱讀 5733

什麼是正規表示式:

描述字串排列的一套規則。

基礎知識

1.原子

原子正規表示式中最基本的組成單位,每個正規表示式中至少要包含乙個原子

(1)普通字元作為原子

(2)非列印字元作為原子 :字串中用於格式控制的字元  如 「\n」,「\t」

(3)通用字元作為原子:乙個原子可以匹配一類字元 「\w」 ,"\w","\d","\d" ,"\s","\s"

(4)原子表:可以定義一組地位平等的原子,然後匹配的時候回取該原子表中的任意原子進行匹配。[xyz]py,[^xyz]py

2.元字元

正規表示式中具有特殊意義的字元。

(1)任意匹配元字元 :    「.」

(2) 邊界限制元字元:「^」匹配字串的開始,「$」匹配字串的結束

(3)限定符:「*」、「?」、「+」、「」、「」、「」

(4)模式選擇符:「|」

(5)模式單元符:「()」將一些原子組成乙個大原子使用

3.模式修正

4.貪婪模式與懶惰模式

貪婪模式即盡可能多的匹配,懶惰模式即盡可能少的匹配

如想在某些字元間匹配任意字元:「p.*y」預設是貪婪模式,轉化為懶惰模式「p.*?y」

正規表示式常見函式 1

.re.match(pattern,string,flag)  表示從源字串的起始位置匹配乙個模式

2.re.search() 在全文中進行搜尋並匹配

3.全域性匹配函式:將符合模式的內容全部匹配(>=1)出來

思路如下:(1)使用re.compile()對正規表示式進行預編譯

(2)編譯後,使用findall()根據正規表示式從源字串中將匹配的結果全   部找出。

4.re.sub(pattern,rep,string,max) 根據正規表示式實現替換某些字串的功能。  

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...