Python正規表示式小結

2021-09-27 08:22:34 字數 1332 閱讀 4661

python正規表示式總結:

1.了解正規表示式

正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成乙個「規則字串」,這個「規則字串」用來表達對字串的一種過濾邏輯。

正規表示式是用來匹配字串非常強大的工具,在其他程式語言中同樣有正規表示式的概念,python同樣不例外,利用了正規表示式,我們想要從返回的頁面內容提取出我們想要的內容就易如反掌了。

正規表示式的大致匹配過程是:

1.依次拿出表示式和文字中的字元比較,

2.如果每乙個字元都能匹配,則匹配成功;一旦有匹配不成功的字元則匹配失敗。

3.如果表示式中有量詞或邊界,這個過程會稍微有一些不同。

常用方法:

行定位符:『^』表示行的開始位置;『$』表示行的末尾

元字串:

** 說明

『.』 匹配除換行符以外的任意字元

\w 匹配字母,數字,下劃線或漢字

\s 匹配任意的空格字元

\d 匹配數字

\b 匹配單詞的開始或結束

^ 匹配字串的開始

$ 匹配字串的結束

限定符限定符 說明 舉例

? 匹配前面的字元零次或一次 colou?r,該表示式可匹配colour和color

+ 匹配前面的字元一次或多次 go+gle,該表示式可以匹配的範圍從gogle到goo……gle

* 匹配前面的字元零次或多次 go*gle,該表示式可以匹配的範圍從ggle到goo……gle

匹配前面的字元n次 gogle,該表示式只匹配google

匹配前面的字元最少n次 gogle,該表示式可以匹配的範圍從google到goo……gle

匹配前面的字元最少n,最多m次 employe,該表示式可以匹配employ,employe和employee3種情況

字元類:只需要在方括號裡列出他們就行如:[aeiou]

• re.i(全拼:ignorecase): 忽略大小寫(括號內是完整寫法,下同)

• re.m(全拼:multiline): 多行模式,改變』^『和』$『的行為(參見上圖)

• re.s(全拼:dotall): 點任意匹配模式,改變』.'的行為

• re.l(全拼:locale): 使預定字元類 \w \w \b \b \s \s 取決於當前區域設定

• re.u(全拼:unicode): 使預定字元類 \w \w \b \b \s \s \d \d 取決於unicode定義的字元屬性

• re.x(全拼:verbose): 詳細模式。這個模式下正規表示式可以是多行,忽略空白字元,並可以加入注釋

在剛才所說的另外幾個方法例如 re.match 裡我們就需要用到

fei 正規表示式 正規表示式小結

常用的元字元常用的反義 常用的限定符 語法 說明 語法 說明 語法 說明 w 匹配字母或數字或下劃線或漢字 w匹配任意不是字母 數字 下劃線 漢字的字元 重複零次或者更多次 s匹配任意的空白字元 s匹配任意不是空白符的字元 重複一次或更多次 d匹配數字 d匹配任意非數字的字元 重複零次或一次 b匹配...

正規表示式小結

正規表示式 regex 英 red eks 1,d d d d或者是 d 表示匹配4位數的數字。2.說明。這些可被稱作元字元。匹配除換行符以外的任意字元1 jk2yh jj w數字字母漢字下劃線 bst456 5ghgtft s匹配任意的空白符 space table鍵和半全形空格 d匹配數字 di...

正規表示式小結

最近學習了正規表示式,趁還熱乎,寫下這篇部落格,記錄一下。正規表示式 英語 regular expression,在 中常簡寫為regex 正規表示式是乙個字串,使用單個字串來描述 用來定義匹配規則,匹配一系列符合某個句法規則的字串。在開發中,正規表示式通常被用來檢索 替換那些符合某個規則的文字,也...