常用的正規表示式匹配規則模式
描述\w
匹配字母、數字、下劃線,等價於[a-za-z0-9_]\w可以匹配漢字(python),
\w匹配不是字母、數字、下劃線的其他字元
\s匹配任意空白字元,等價於(\t\n\r\f)
\s匹配任意非空字元
\d匹配數字,等價於[0-9]
\d匹配不是數字的字元
\a匹配字串開頭
\z匹配字串結尾的,如果存在換行,只匹配到換行前的結束字串
\z匹配字串結尾的,如果存在換行,匹配到換行符\n
\g最好完成匹配的位置
\n匹配乙個換行符
\t匹配乙個製表符(tab)
^匹配一行字串的開頭
$匹配一行字串的結尾
.匹配任意字元,除了換行符.當re.dotall標記被指定時,這可以匹配包括換行符在內的任字元
[…]用來表示一組字元,比如[abc]表示匹配a或b或c,[a-z],[0-9]
[^…]
匹配不在裡面的字元,比如[^abc]匹配除a,b,c以外的字元
*匹配0個或多個字元
+匹配1個或多個字元
?匹配0個或1個前面的正規表示式片段,(.*?)表示盡可能少地匹配字元(後面詳解)
精確匹配前面n個前面的表示式,如\d表示匹配5個數字
匹配前面的表示式n到m次,貪婪模式
a|b匹配a或者b
(…)匹配括號裡的表示式,也可以表示乙個組
這個表很重要,但也不用死記硬背,因為又不是讓你考試,下面會列舉一些非常常用的匹配規則,剩下的就等要用了再查表就可以了更多正規表示式可以參考下面這篇文章:[1-9]\d(?!\d)
最全的常用正規表示式大全——包括校驗數字、字元、一些特殊的需求等等 - zxin -
正規表示式 匹配規則
一切從最基本的開始。模式,是正規表示式最基本的元素,它們是一組描述字串特徵的字元。模式可以很簡單,由普通的字串組成,也可以非常複雜,往往用特殊的字元表示乙個範圍內的字元 重複出現,或表示上下文。例如 once這個模式包含乙個特殊的字元 表示該模式只匹配那些以once開頭的字串。例如該模式與字串 on...
正規表示式 匹配規則
一切從最基本的開始。模式,是正規表示式最基本的元素,它們是一組描述字串特徵的字元。模式可以很簡單,由普通的字串組成,也可以非常複雜,往往用特殊的字元表示乙個範圍內的字元 重複出現,或表示上下文。例如 once這個模式包含乙個特殊的字元 表示該模式只匹配那些以once開頭的字串。例如該模式與字串 on...
正規表示式的匹配規則
大部分字元在正規表示式中,就是字面的含義,比如 a 匹配 a,b 匹配b。這種只表示它字面量含義的被稱為字面量字元。除了字面量,還有一些字元有特殊含義,不代表字面意思,被稱為元字元 1,點字元 點字元匹配除回車 r 換行 n 行分隔符 u2028 和分段符 u2029 之外的所有字元 注 碼點大於0...