在python中定義規則(正規表示式),要匯入re模組。
import re
match、r和\:
match
從頭開始匹配
r原生字串\轉義
字元功能
.匹配任意乙個字元,除\n
匹配中列舉的字元
/d匹配數字0-9
/d匹配非數字 [^0-9]
/w匹配數字(0-9)、字母(a-z和a-z)、下劃線(_)
/w匹配 非 數字(0-9)、字母(a-z和a-z)、下劃線(_) [^\w]
/s匹配空格、tab鍵
/s匹配非空格、tab鍵 [^\s]
字元功能
*匹配前乙個字元出現無數次或沒出現
+匹配前乙個字元至少出現1次或無數次
?匹配前乙個字元出現1次或0次
匹配前乙個字元出現m次
匹配前乙個字元出現m到n次
字元功能
^匹配字串開頭,多行匹配每一行開頭
$匹配字串末尾,多行匹配每一行末尾
字元功能
|匹配左右任意乙個表示式(書寫時|左右不留空格)
()將括號中的字元作為乙個分組
\num
引用分組num匹配字串
(?p)
給分組起別名
(?p=name)
引用別名為name分組匹配的規則
方法功能
search
不用從頭開始匹配
findall
統計滿足規則的全部資訊------------>返回的是乙個列表
sub將匹配到的資料進行替換(資料清洗)
正規表示式通常用於在文字中查詢匹配的字串。python裡數量詞預設是貪婪的(在少數語言裡也可能是預設非貪婪),總是嘗試匹配盡可能多的字元;非貪婪的則相反,總是嘗試匹配盡可能少的字元。例如:正規表示式"ab*「如果用於查詢"abbbc」,將找到"abbb"。而如果使用非貪婪的數量詞"ab*?",將找到"a"。
python中的正規表示式
正規表示式是一種用來匹配字串的強有力的 它的設計思想是用一種描述性的語言來給字串定義乙個規則,凡是符合規則的字串,我們就認為它 匹配 了,否則,該字串就是不合法的。因為正規表示式也是用字串表示的,所以,我們要首先了解如何用字元來描述字元。在正規表示式中,如果直接給出字元,就是精確匹配。用 d可以匹配...
Python中的正規表示式
在使用python製作爬蟲之前,我們必須要對python的正規表示式有一定的了解,在python中使用正規表示式要匯入re包 d匹配數字1 9 w匹配字元 匹配集合裡面的字元 匹配前面出現的正規表示式1次或多次 表示匹配任意乙個字元,除換行符除外,x.匹配xy23中的xy,若是x.則匹配出xy2 表...
Python中的正規表示式
對應 abc 001 s r abc 001 加r字首,就不用考慮轉義的問題了。print re.match d d 010 12345 匹配成功返回乙個match物件,否則返回none.re.match 的常見寫法 test 輸入字串 if re.match 正規表示式 test print ok...