常用的匹配規則與常用正規表示式

2022-09-18 20:12:12 字數 1956 閱讀 7290

模式描述

\w

匹配字母、數字及下劃線

\w

匹配不是字母、數字及下劃線的字元

\s

匹配任意空白字元,等價於[\t\n\r\f]

\s

匹配任意非空字元

\d

匹配任意數字,等價於[0-9]

\d

匹配任意非數字的字元

\a

匹配字串開頭

\z

匹配字串結尾,如果存在換行,只匹配到換行前的結束字串

\z

匹配字串結尾,如果存在換行,同時還會匹配換行符

\g

匹配最後匹配完成的位置

\n

匹配乙個換行符

\t

匹配乙個製表符

^

匹配一行字串的開頭

$

匹配一行字串的結尾

.

匹配任意字元,除了換行符,當re.dotall標記被指定時,則可以匹配包括換行符的任意字元

[...]

用來表示一組字元,單獨列出,比如[amk]匹配amk

[^...]

不在中的字元,比如[^abc]匹配除了abc之外的字元

*

匹配0個或多個表示式

+

匹配1個或多個表示式

?

匹配0個或1個前面的正規表示式定義的片段,非貪婪方式

精確匹配n個前面的表示式

匹配nm次由前面正規表示式定義的片段,貪婪方式

a|b匹配ab

()

匹配括號內的表示式,也表示乙個組

開源中國提供的正規表示式測試工具:

匹配內容

正規表示式

漢字^[\u4e00-\u9fa5]$

空白行\n\s*\r

郵箱位址

/.+@.+\.[a-z]+/

手機號^1(3|4|5|6|7|8|9)\d$

[1-9]\d(?!\d)

18位身份證號

^(\d)(\d)(\d)(\d)(\d)([0-9]|x)$

通用時間

(20\d([.-/|年月\s]\d)日?(\s?\d:\d(:\d)?)?)|(\d\s?(分鐘|小時|天)前)

整數^-?[1-9]\d*$

網域名稱^((http://)|(https://))?(a-za-z0-9?.)+[a-za-z](/)

ip((?

常用的正規表示式匹配規則

常用的正規表示式匹配規則模式 描述 w 匹配字母 數字 下劃線,等價於 a za z0 9 w可以匹配漢字 python w匹配不是字母 數字 下劃線的其他字元 s匹配任意空白字元,等價於 t n r f s匹配任意非空字元 d匹配數字,等價於 0 9 d匹配不是數字的字元 a匹配字串開頭 z匹配字...

正規表示式 常用的匹配規則

常用的匹配規則 匹配字元 符號匹配規則 匹配任意1個字元,除了換行符 n 這是乙個集合,匹配 中的任意乙個字元 d匹配乙個數字,即0 9 d匹配非數字,即不是數字 s匹配空白,即空格,tab鍵 s匹配非空白 w匹配單詞字元,即a z,a z,0 9 w匹配非單詞字元 匹配前乙個字元出現0次或無數次,...

常用的正規表示式匹配規則整理

u4e00 u9fs5 中文字元 x00 xff 雙位元組字元 文字 n s r 空行 1 html標記 s s 首尾空格 d d d d g ip位址 d 整數 d 非負整數 0 9 1 9 0 9 正整數 d 0 非正整數 0 9 1 9 0 9 負整數 d d 非負浮點數 0 9 0 9 1 ...