正規表示式

2021-10-20 00:27:43 字數 1584 閱讀 8013

正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成乙個「規則字串」,這個「規則字串」用來表達對字串的一種過濾邏輯(可以用來做檢索,擷取或者替換操作)。

正規表示式用於搜尋、替換和解析字串。正規表示式遵循一定的語法規則,使用非常靈活,功能強大。使用正規表示式編寫一些邏輯驗證很方便,例如電子郵件位址格式的驗證。

正規表示式是對字串(包括普通字元(例如,a 到 z 之間的字母)和特殊字元)操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特點字元的組合,組合成乙個「規則字串」,這個「規則字串」用來表達對字串的一種過濾邏輯,正規表示式是一種文字模式,模式描述在搜尋文字時要匹配乙個或多個字串。

給定的字串是否符合正規表示式的過濾邏輯(稱作「匹配」);

可以通過正規表示式,從字串獲取我們想要的特定部分

可以對目標字串進行替換操作

python通過標註庫中的 re 模組支援正規表示式。re 模組提供了一些根據正規表示式進行查詢、替換、分隔字串的函式,這些函式使用乙個正規表示式作為第乙個引數。re 模組常用的函式如下表所示。

re 模組常用的函式

函式描述

match(pattern, string, flags=0)

根據 pattern 從 string 的頭部開始匹配字串,只返回第 1 次匹配成功的物件;否則,返回 none

findall(pattern, string, flags=0)

根據 pattern 在 string 中匹配字串。如果匹配成功,返回包含匹配結果的列表;否則返回空列表。當 pattern 中有分組時,返回包含多個元素的列表,每個元組對應 1 個分組。flags 表示規則選項,規則選項用於輔助匹配

sub(pattern,repl,string,count=0)

根據指定的正規表示式,替換源字串中的子串。pattern 是乙個正則表達 式,repl 是用於替換的字串,string 是源字串。如果 count 等於 0,則 返回 string 中匹配的所有結果;如果 count 大於 0,則返回前 count 個匹配結果

subn(pattern,repl,string,count=0)

作用和 sub()相同,返回乙個二元的元組。第 1 個元素是替換結果,第 2 個元素是替換的次數

search(pattern,string,flags=0)

根據 pattern 在 string 中匹配字串,只返回第 1 次匹配成功的物件。如果 匹配失敗,返回 none

compile(pattern,flags=0)

編譯正規表示式 pattern,返回 1 個 pattern 的物件

split(pattern,string,maxsplit=0)

根據 pattern 分隔 string,maxsplit 表示最大的分隔數

escape(pattern)

匹配字串中的特殊字元,如*、+、?等

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...