正規表示式(regular expression),又稱正規表示式、規則表示式等,是電腦科學的乙個概念。正規表示式使用單個字串來描述、匹配一系列匹配某個句法規則的字串,也通常用來檢索、替換那些匹配某個模式的文字。下面從以下方面開始講述正規表示式在python中的應用。
1.在python中使用,首先需要匯入乙個包,即re模組
2.re模組示例
3.一般的使用步驟
(1)使用complie()函式將正規表示式的字串形式編譯為乙個pattern物件
(2)通過pattern物件提供的一系列方法對文字進行匹配查詢,獲得匹配的結果
(3)這些pattern物件提供的方法有:
(4)示例
match():能夠匹配出以***開頭的字串
search():從任何位置開始查詢,一次匹配
findall():全部匹配,返回列表
finditer():全部匹配,返回迭代器
spilt():分割字串,返回列表
sub():替換
字元
作用.
匹配任意1個字元(除\n)
[ ]匹配[ ]中列舉的字元
\d匹配數字,即0-9
\d匹配非數字,即不是數字
\w匹配單詞字元,即a-z、a-z、0-9、_
\w匹配非單詞字元
\s匹配空白,即 空格,tab鍵
\s匹配非空白
.匹配任意乙個字元(除\n)
[ ] 匹配[ ]中列舉的字元
\d 匹配數字,即0-9
\d 匹配非數字
\w 匹配單詞字元
字元
作用
*匹配前乙個字元出現0次或者無限次
+匹配前乙個字元出現1次或者無限次,即至少有1次
?匹配前乙個字元出現1次或者0次
匹配前乙個字元出現m次
匹配前乙個字元至少出現m次
匹配前乙個字元出現從m到n次
* 匹配前乙個字元出現0次或者無限次
+ 匹配前乙個字元出現1次或者無限次,即至少有1次
匹配前乙個字元出現m次
字元作用
^匹配字串開頭
$匹配字串結尾
\b匹配乙個單詞的邊界
\b匹配非單詞邊界
字元作用
|匹配左右任意乙個表示式
(ab)
將括號中字元作為乙個分組
\num
引用分組num匹配到的字串
(?p)
分組起別名
(?p=name)
引用別名為name分組匹配到的字串
| 匹配左右任意乙個表示式
正規表示式詳解
正規表示式 基本正規表示式主要用於grep,egrep,vi,sed,awk命令中進行字串匹配。符號 意義 c 匹配字母c 匹配任意單個字元 匹配前乙個字元出現零次或多次 匹配任意多個任意字元 匹配集合中的任意單個字元,括號中為乙個集合 x y 匹配連續的字串範圍 匹配字串的開頭 匹配字串的結尾 匹...
正規表示式詳解
正規表示式主要作用 分割 匹配 查詢 替換 正規表示式中包括的元素 1.原子 普通字元 a z a z 0 9 原子表 轉義字元 2.元字元 有特殊功能的字元 3.修正模式符 系統內建部分字元,例如 i m s u 原子 1.a z a z 0 9 最常見的字元 2.abc 用圓括號包含起來的單元符...
詳解正規表示式
c 字元c 0n 八進位制0n代表的字元 0 n 7 0nn 八進位制0nn代表的字元 0 n 7 0mnn 八進位制0mnn代表的字元 0 m 3,0 n 7 xnn 十六進製制 0xnn所代表的字元 uhhhh 十六進製制 0xhhhh所代表的字元 t製表符 n換行符 r回車符 f換頁符 a報警...