模式描述
\w
匹配字母、數字及下劃線
\w
匹配不是字母、數字及下劃線的字元
\s
匹配任意空白字元,等價於[\t\n\r\f]
\s
匹配任意非空字元
\d
匹配任意數字,等價於[0-9]
\d
匹配任意非數字的字元
\a
匹配字串開頭
\z
匹配字串結尾,如果存在換行,只匹配到換行前的結束字串
\z
匹配字串結尾,如果存在換行,同時還會匹配換行符
\g
匹配最後匹配完成的位置
\n
匹配乙個換行符
\t
匹配乙個製表符
^
匹配一行字串的開頭
$
匹配一行字串的結尾
.
匹配任意字元,除了換行符,當re.dotall標記被指定時,則可以匹配包括換行符的任意字元
[...]
用來表示一組字元,單獨列出,比如[amk]
匹配a
、m
或k
[^...]
不在中的字元,比如
[^abc]
匹配除了a
、b
、c
之外的字元
*
匹配0個或多個表示式
+
匹配1個或多個表示式
?
匹配0個或1個前面的正規表示式定義的片段,非貪婪方式
精確匹配n
個前面的表示式
匹配n
到m
次由前面正規表示式定義的片段,貪婪方式
a|b匹配a
或b
()
匹配括號內的表示式,也表示乙個組
開源中國提供的正規表示式測試工具:
匹配內容
正規表示式
漢字^[\u4e00-\u9fa5]$
空白行\n\s*\r
郵箱位址
/.+@.+\.[a-z]+/
手機號^1(3|4|5|6|7|8|9)\d$
[1-9]\d(?!\d)
18位身份證號
^(\d)(\d)(\d)(\d)(\d)([0-9]|x)$
通用時間
(20\d([.-/|年月\s]\d)日?(\s?\d:\d(:\d)?)?)|(\d\s?(分鐘|小時|天)前)
整數^-?[1-9]\d*$
網域名稱^((http://)|(https://))?(a-za-z0-9?.)+[a-za-z](/)
ip((?
常用的正規表示式匹配規則
常用的正規表示式匹配規則模式 描述 w 匹配字母 數字 下劃線,等價於 a za z0 9 w可以匹配漢字 python w匹配不是字母 數字 下劃線的其他字元 s匹配任意空白字元,等價於 t n r f s匹配任意非空字元 d匹配數字,等價於 0 9 d匹配不是數字的字元 a匹配字串開頭 z匹配字...
正規表示式 常用的匹配規則
常用的匹配規則 匹配字元 符號匹配規則 匹配任意1個字元,除了換行符 n 這是乙個集合,匹配 中的任意乙個字元 d匹配乙個數字,即0 9 d匹配非數字,即不是數字 s匹配空白,即空格,tab鍵 s匹配非空白 w匹配單詞字元,即a z,a z,0 9 w匹配非單詞字元 匹配前乙個字元出現0次或無數次,...
常用的正規表示式匹配規則整理
u4e00 u9fs5 中文字元 x00 xff 雙位元組字元 文字 n s r 空行 1 html標記 s s 首尾空格 d d d d g ip位址 d 整數 d 非負整數 0 9 1 9 0 9 正整數 d 0 非正整數 0 9 1 9 0 9 負整數 d d 非負浮點數 0 9 0 9 1 ...