我將從正規表示式開始講python的標準庫。正規表示式是文書處理中常用的工具,而且不需要額外的系統知識或經驗。我們會把系統相關的包放在後面講解。
正規表示式(regular expression)主要功能是從字串(string)中通過特定的模式(pattern),搜尋想要找到的內容。
語法之前,我們簡介了字串相關的處理函式。我們可以通過這些函式實現簡單的搜尋功能,比如說從字串「i love you」中搜尋是否有「you」這一子字串。但有些時候,我們只是模糊地知道我們想要找什麼,而不能具體說出我是在找「you」,比如說,我想找出字串中包含的數字,這些數字可以是0到9中的任何乙個。這些模糊的目標可以作為資訊寫入正規表示式,傳遞給python,從而讓python知道我們想要找的是什麼。
(官方documentation)
在python中使用正規表示式需要標準庫中的乙個包re。
import re
m = re.search('[0-9]','abcd4ef')
print(m.group(0))
re.search()接收兩個引數,第乙個'[0-9]'就是我們所說的正規表示式,它告訴python的是,「聽著,我從字串想要找的是從0到9的乙個數字字元」。
re.search()如果從第二個引數找到符合要求的子字串,就返回乙個物件m,你可以通過m.group()的方法檢視搜尋到的結果。如果沒有找到符合要求的字元,re.search()會返回none。
如果你熟悉linux或者perl, 你應該已經熟悉正規表示式。當我們開啟linux shell的時候,可以用正規表示式去查詢或著刪除我們想要的檔案,比如說:
$rm book[0-9][0-9].txt
這就是要刪除類似於book02.txt的檔案。book[0-9][0-9].txt所包含的資訊是,以book開頭,後面跟兩個數字字元,之後跟有".txt"的檔名。如果不符合條件的檔名,比如說:
Python標準庫01 正規表示式 re包
摘要 python正規表示式標準庫介紹我將從正規表示式開始講python的標準庫。正規表示式是文書處理中常用的工具,而且不需要額外的系統知識或經驗。我們會把系統相關的包放在後面講解。正規表示式 regular expression 主要功能是從字串 string 中通過特定的模式 pattern 搜...
Python標準庫01 正規表示式 re包
我將從正規表示式開始講python的標準庫。正規表示式是文書處理中常用的工具,而且不需要額外的系統知識或經驗。我們會把系統相關的包放在後面講解。正規表示式 regular expression 主要功能是從字串 string 中通過特定的模式 pattern 搜尋想要找到的內容。之前,我們簡介了字串...
轉 Python標準庫01 正規表示式 re包
我將從正規表示式開始講python的標準庫。正規表示式是文書處理中常用的工具,而且不需要額外的系統知識或經驗。我們會把系統相關的包放在後面講解。正規表示式 regular expression 主要功能是從字串 string 中通過特定的模式 pattern 搜尋想要找到的內容。之前,我們簡介了字串...