最近在學python爬蟲、接觸到了正規表示式、苦於好多都記不住、特此記錄一下。
\w 匹配字母數字及下劃線
\w 匹配f非字母數字下劃線
\s 匹配任意空白字元,等價於[\t\n\r\f]
\s 匹配任意非空字元
\d 匹配任意數字
\d 匹配任意非數字
\a 匹配字串開始
\z 匹配字串結束,如果存在換行,只匹配換行前的結束字串
\z 匹配字串結束
\g 匹配最後匹配完成的位置
\n 匹配乙個換行符
\t 匹配乙個製表符
^ 匹配字串的開頭
$ 匹配字串的末尾
. 匹配任意字元,除了換行符,re.dotall標記被指定時,則可以匹配包括換行符的任意字元
[....] 用來表示一組字元,單獨列出:[amk]匹配a,m或k
[^...] 不在中的字元:[^abc]匹配除了a,b,c之外的字元
* 匹配0個或多個的表示式
+ 匹配1個或者多個的表示式
? 匹配0個或1個由前面的正規表示式定義的片段,非貪婪方式
精確匹配n前面的表示
匹配n到m次由前面的正規表示式定義片段,貪婪模式
a|b 匹配a或者b
() 匹配括號內的表示式,也表示乙個組
補充
正規表示式 常用正規表示式
一 校驗數字的表示式 1 數字 0 9 2 n位的數字 d 3 至少n位的數字 d 4 m n位的數字 d 5 零和非零開頭的數字 0 1 9 0 9 6 非零開頭的最多帶兩位小數的數字 1 9 0 9 0 9 7 帶1 2位小數的正數或負數 d d 8 正數 負數 和小數 d d 9 有兩位小數的...
正規表示式 常用正規表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 4 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 或者 1 3...
常用正規表示式
0 9 0 9 0 9 數字或小數點 0 9 0 9 或 d d 數字和小數點 驗證手機號碼 function checkstr str if reg.test str return true 2位小數 function checknumber str if reg.test str return ...