python 資料分析 正規表示式

2021-09-27 02:06:57 字數 2042 閱讀 2187

正規表示式就是記錄文字規則的**,我們將從正規表示式基礎和re模組實現兩個方面來說

python提供了re模組,用於實現正規表示式的操作。在實現時,可以使用re模組提供的方法,如search(),match(),findall()進行字串處理,也可以使用re模組的compile()方法將模式字串轉換為正規表示式物件,然後再使用該正規表示式物件的相關方法來操作字串。

2.1 使用match()方法進行匹配

match()方法用於從字串的開始處進行匹配,如果再開始處匹配成功,則返回match物件,否則返回none

import re

pattern = r"mr_\w+"

string = "mr_shop mr_shop"

match = re.match(pattern, string, re.i)

print(match)

string = "1234"

match = re.match(pattern, string, re.i)

print(match)

返回結果分別為

none
同時,如果返回match類,還有以下幾個引數可以呼叫

2.2 使用search()方法進行匹配

search()方法用於在整個字串中搜尋第乙個匹配的值,如果匹配成功返回match物件。該方法的呼叫同match物件。

import re

pattern = r"mr_\w+"

string1 = "mr_shop mr_shop"

match1 = re.search(pattern, string1, re.i)

print(match1)

string2 = "你好mr_shop mr_shop"

match2 = re.search(pattern, string2, re.i)

print(match2)

【running】***************==

2.3 使用findall() 方法進行匹配

findall() 方法用於在整個字串中搜尋所有符合正規表示式的字串,並以列表的形式返回(返回不同於前兩種方法)。語法格式與上兩個基本相似

import re

pattern = r"mr_\w+"

string1 = "mr_shop mr_shop"

match1 = re.findall(pattern, string1, re.i)

print(match1)

string2 = "你好mr_shop mr_shop"

match2 = re.findall(pattern, string2, re.i)

print(match2)

【running】

['mr_shop', 'mr_shop']

['mr_shop', 'mr_shop']

2.4 替換字串

sub()字串用於實現字串替換

re.sub(pattern, repl, string, count, flags)

import re

pattern = r'1[345678]\d'

result = re.sub(pattern, '1*********x', string)

print(result)

2.5 分割字串

re.split(pattern, string, [maxsplit], [flags])

import re

pattern = r'[?|&]'

string = 'niafeibuvos&boiabfabv?vewivbow&nbivoosb'

result = re.split(pattern, string)

print(result)

執行結果為:[『niafeibuvos』, 『boiabfabv』, 『vewivbow』, 『nbivoosb』]

大資料分析Python正規表示式有哪些

此正規表示式備忘單基於python 3的正規表示式文件。如果您對學習python感興趣,我們可以免費提供互動式的初學者和中級python程式設計課程。大資料分析的正規表示式 pdf 特殊的角色 在字串的開頭匹配表示式右側。它匹配 n字串中每個這樣的例項。將表示式匹配到字串末尾的左側。它匹配 n字串中...

正規表示式分析

1.請分析這下面這兩個輸出吧,最好乙個乙個斜槓地分析。system.out.println 8abc8 replaceall 8 8abc system.out.println 8abc8 replaceall 8 8abc 2.為什麼a和b可以有相同的輸出,c和d卻不可以呢?system.out....

python正規表示式元字元 正規表示式

字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...