什麼是正規表示式:
描述字串排列的一套規則。
基礎知識
1.原子
原子正規表示式中最基本的組成單位,每個正規表示式中至少要包含乙個原子
(1)普通字元作為原子
(2)非列印字元作為原子 :字串中用於格式控制的字元 如 「\n」,「\t」
(3)通用字元作為原子:乙個原子可以匹配一類字元 「\w」 ,"\w","\d","\d" ,"\s","\s"
(4)原子表:可以定義一組地位平等的原子,然後匹配的時候回取該原子表中的任意原子進行匹配。[xyz]py,[^xyz]py
2.元字元
正規表示式中具有特殊意義的字元。
(1)任意匹配元字元 : 「.」
(2) 邊界限制元字元:「^」匹配字串的開始,「$」匹配字串的結束
(3)限定符:「*」、「?」、「+」、「」、「」、「」
(4)模式選擇符:「|」
(5)模式單元符:「()」將一些原子組成乙個大原子使用
3.模式修正
4.貪婪模式與懶惰模式
貪婪模式即盡可能多的匹配,懶惰模式即盡可能少的匹配
如想在某些字元間匹配任意字元:「p.*y」預設是貪婪模式,轉化為懶惰模式「p.*?y」
正規表示式常見函式 1
.re.match(pattern,string,flag) 表示從源字串的起始位置匹配乙個模式
2.re.search() 在全文中進行搜尋並匹配
3.全域性匹配函式:將符合模式的內容全部匹配(>=1)出來
思路如下:(1)使用re.compile()對正規表示式進行預編譯
(2)編譯後,使用findall()根據正規表示式從源字串中將匹配的結果全 部找出。
4.re.sub(pattern,rep,string,max) 根據正規表示式實現替換某些字串的功能。
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...