一些基本用法:記錄一下,以備不時之需
字元匹配:
1:普通字元。
大多數字母和字元一般都會和自身匹配
2:元字元:
. 任意乙個字元(換行符除外)
^ 匹配行首,放在要匹配字串頭部 r = r"^hello"
$ 匹配行尾,放在字串尾部 r = r"hello$"
常用來指定乙個字符集[abc],[a-z],表示匹配其中任意乙個字元即可,元字元在
字符集中不起作用,在中出現^,寫在開始處,表示補集匹配
\ 將元字元轉義成普通字元,也可以後面加不同的字元以表示不同的特殊意義
\d ---[0-9]
\d----[^0-9]
\w----匹配任意字母數字[a-za-z0-9]
\w----[^a-za-z0-9]
與重複相關:
* 匹配前乙個字元0次或更多次 r="ab*", a,ab,abbbb.
+ 匹配前乙個字元一次或者多次
?匹配前乙個字元0次或一次。
貪婪模式 r = "ab+" re.findall(r,"abbbbb"),預設返回abbbbb 最大匹配
非貪婪模式 r = "ab+?" re.findadd(r,"abbbbb"),返回ab. 最小匹配
至少m次,至多n次.
== * == + == ?
分組:email = "\w@\w+(\.com)"
re.findall(email,"[email protected]") 加上()只返回.com
()也可用於分組(\.com|\.cn)表示匹配.com或.cn
re模式還有一些引數可以指定。(re.i表示不區分大小寫等,需要時上網查詢即可)
正規表示式個人總結
1 數量限定符號,表示匹配次數 或者叫做長度 的符號 包括 0次或者多次 1次或者多次 0次或者1次 匹配n次,n為整數 匹配從n到m之間的某個數的次數 n和m都是整數 匹配n到無窮次之間任意次數 匹配0到m之間任意次數 他們放到匹配格式的後面 例如 號碼 024 84820482,02484820...
個人常用正規表示式總結
正規表示式中的反斜線 即轉義符 用來表示轉義序列,或去掉元字元的轉義。元字元包括 所以需要匹配元字元時需要加上反斜線 windows系統中不支援的字元包括 所以可以採用正規表示式去除這些符號。是轉義字元,使得跟在他後邊的單引號不與字串的格式引號衝突 doesn t doesn t t表示空四個字元,...
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...