詳解 Python 正規表示式

2021-10-09 07:13:54 字數 2039 閱讀 7306

正規表示式是對字串(a - z)& 特殊字元(稱為「元字元」)操作的一種邏輯公式。

就是用事先定義好的一些特定字元、及這些特定字元的組合,組成乙個「規則字串」,這個「規則字串」用來表達對文字 or 字串 的 一種過濾邏輯

正規表示式,又稱規則表示式(regular expression ,簡稱 re )。正規表示式主要用於 函式

功能re .compile()

根據乙個模式字串和可選的標誌引數,生成乙個正規表示式物件

re.search()

在乙個字串中搜尋匹配正規表示式的第乙個位置,返回match物件

re.match()

在乙個字串的開始位置匹配正規表示式,返回match物件

re.findall()

搜尋字串,以列表的形式返回全部能匹配的子串

re.split()

將乙個字串按照正規表示式匹配的結果進行分割,返回列表型別

re.finditer()

搜尋字串,返回乙個匹配的迭代型別,每個迭代元素是match物件

re.sub()

在乙個字串中替換所有匹配正規表示式的子串,返回替換後的字串

compile() 根據乙個模式字串和可選的標誌引數,生成乙個正規表示式物件( pattern ),供 match() 替換 和 search() 匹配 這兩個函式使用。

# 函式語法:

re.compile

( pattern [

, flags]

)

函式引數說明:

re.match 嘗試從字串的起始位置匹配乙個模式,如果不是起始位置匹配成功的話,match()就返回none。

# 函式語法:

re.match(pattern, string, flags=

0)

函式引數說明:

re.search 掃瞄整個字串,並返回 第乙個 匹配 pattern 的匹配物件。

# 函式語法:

re.search(pattern, string, flags=

0)

函式引數說明:

re.match 必須從字串開始處就匹配,如果字串開始不符合正規表示式,則匹配失敗,函式返回 none,

而 re.search 匹配整個字串,直到找到乙個匹配。

re.sub 替換字串中的匹配項

# 函式語法:

re.sub(pattern, repl, string, count=

0, flags=

0)

函式引數說明:

前三個為必選引數,後兩個為可選引數。

在字串中找到正規表示式所匹配的所有子串,並返回乙個列表,如果沒有找到匹配的,則返回空列表。

注意: match 和 search 是匹配一次 findall 匹配所有。

# 函式語法:

re.findall(pattern, string, flags=0)

orpattern.findall(string [

, pos[

, endpos]

])

函式引數說明:

和 findall 類似,在字串中找到正規表示式所匹配的所有子串,並把它們作為乙個迭代器返回。

# 函式語法:

re.finditer(pattern, string, flags=

0)

函式引數說明:

split 方法按照能夠匹配的子串將字串分割後返回列表,它的使用形式如下:

# 函式語法:

re.split(pattern, string[

, maxsplit=

0, flags=0]

)

函式引數說明:

正規表示式詳解

正規表示式 基本正規表示式主要用於grep,egrep,vi,sed,awk命令中進行字串匹配。符號 意義 c 匹配字母c 匹配任意單個字元 匹配前乙個字元出現零次或多次 匹配任意多個任意字元 匹配集合中的任意單個字元,括號中為乙個集合 x y 匹配連續的字串範圍 匹配字串的開頭 匹配字串的結尾 匹...

正規表示式詳解

正規表示式主要作用 分割 匹配 查詢 替換 正規表示式中包括的元素 1.原子 普通字元 a z a z 0 9 原子表 轉義字元 2.元字元 有特殊功能的字元 3.修正模式符 系統內建部分字元,例如 i m s u 原子 1.a z a z 0 9 最常見的字元 2.abc 用圓括號包含起來的單元符...

正規表示式詳解

正規表示式 regular expression 又稱正規表示式 規則表示式等,是電腦科學的乙個概念。正規表示式使用單個字串來描述 匹配一系列匹配某個句法規則的字串,也通常用來檢索 替換那些匹配某個模式的文字。下面從以下方面開始講述正規表示式在python中的應用。1.在python中使用,首先需要...