正規表示式(regular
expression)用於指定字串的模式,可以在任何需要定位匹配某種特定模式的字串的情況下使用正規表示式,正規表示式的語法如下:
語法解釋
字元
c表示字元 c
\unnnn,\xnn,\0n,\0nn,\0nnn
具有給定十六進製制或者十進位制值的碼元
\t,\n,\r,\f,\a
控制符:製表符、換行符、回車符、換頁符、警告符
字元類
[c1,c2,…]
任何由c1、c2,…表示的字元,其中c1可以表示多個字元,字元範圍c1-c2或者字元類
[^…]
排除匹配,^之後的字元不能匹配
[… && …]
二個字符集的交集
預定義字元類
.除了行終止符之外的所有字元(在 dotall 標誌被設定時,則表示所有字元)
\d乙個數字,等價 [0-9]
\d乙個非數字,等價[^0-9]
\s乙個空白字元[\t\n\r\f\x0b]
\s乙個非空白字元
\w乙個詞語字元[a-za-z0-9_]
\w乙個非詞語字元
\p乙個命名字元類,命名字元參考命名字元表
\p乙個命名字元類的補集
邊界匹配符
^ $表示輸入的開頭和結尾(或者在多行模式下行的開頭和結尾)
\b乙個詞語邊界
\b乙個非詞語邊界
\a輸入的開頭
\z輸入的結尾
\z除了行終止符之外的輸入結尾
\g前乙個匹配的結尾
量詞
x?可選的x
x*x重複0次或多次
x+x重複1次或多次
x x x
x重複n次,至少n次,在n到m次之間
量詞字尾
?在預設(貪婪)匹配轉變為勉強匹配
+在預設(貪婪)匹配轉變為占用匹配
集合操作
xy在任何x中的字串,後面跟隨任何y中的字串
x|y任何x或y中的字串
群組
(x)將x做為群組
\n第 n 個群組的匹配
匹配標誌:
常用方法說明:
matches() 對整個文字匹配正規表示式。換句話說,如果正規表示式匹配文字開頭而不匹配整個文字,lookingat() 返回true,而matches() 返回false
示例**:
正規表示式 正規表示式函式 筆記
筆記直接使用pycharm製作,需要原始檔請私聊。正規表示式函式 1.match 2.search 3.全域性匹配函式 全域性匹配 re.compile 正規表示式 findall 資料 import re string poythonydasadcasa pat2 p.y 懶惰模式執行 較精準 r...
正規表示式筆記
不同的語系編碼的順序不一樣 lang c 0 1 2 3 a b c d z a b c d z lang zh cn 0 1 2 3 4 a a b b c c z z 使用正規表示式時,需要留意環境的語系是什麼,否則會有不同的結果 alnum 英文大小寫字元及數字 0 9 a z a z alp...
正規表示式筆記
d 0 9中的任意乙個數字 w a z,a z,0 9,中的任意乙個,即字母數字下劃線 s 空格,製表符,換頁符等空白字元的其中任意乙個 小數點可以匹配換行符 n 以外的任意乙個字元 匹配某範圍內的任意乙個字元 ab9 匹配 a b 9 中的任意乙個 abc 匹配abc之外的任意乙個字元 a g 匹...