最近一段時間在研究nginx的rewirte重寫機制,因此對re需要有一定的了解,看了想關的文章,因此自己來寫一篇類似總結性的的文章。
基本來說,正規表示式是一種用來描述一定數量文字的模式。regex=regular express。本文用<< regex>>來表示一段具體的正規表示式。一段文字就是最基本的模式,簡單的匹配相同的文字。
正規表示式引擎是一種可以處理正規表示式的軟體。通常,引擎是更大應用程式的一部分,我們集中討論的是prel 5引擎。
最基本的正規表示式是由
單個文字元號組成。如<>,它將匹配字串中第一次出現的字元「a」。例如字串「wangzhengyi is a boy」。"w"後的「a」將被匹配,而第二個「a」將不會被匹配。
正規表示式也可以匹配第二個「
a類似的,
<>
會匹配「
about cats and dogs
」中的「
cat」。這等於是告訴正規表示式引擎,找到乙個
<>
,緊跟乙個
<>
,再跟乙個
<>。
要注意,正規表示式引擎預設是大小寫敏感的。除非你告訴引擎忽略大小寫,否則
<>
不會匹配「
cat」。
對於文字字元,有
11個字元被保留作特殊用途。他們是:
[ ] \ ^ $ . | ? * + ()
這些特殊字元也被稱作元字元。
re正規表示式
1.數字 0 9 2.n位的數字 d 3.至少n位的數字 d 4.m n位的數字 d 5.零和非零開頭的數字 0 1 9 0 9 6.非零開頭的最多帶兩位小數的數字 1 9 0 9 0 9 7.帶1 2位小數的正數或負數 d d 8.正數 負數 和小數 d d 9.有兩位小數的正實數 0 9 0 9...
Re正規表示式
import re 匯入re模組 重複出現的字串 對於重複出現的字串可以用大括號內部加上重複次數的方式表達 r d 分組 使用小括號分組 r d d 重複出現的字串 對於重複出現的字串可以用大括號內部加上重複次數的方式表達 r d 重複出現的字串 對於重複出現的字串可以用大括號內部加上重複次數的方式...
re正規表示式
原子表 xyz abc,其中x,y,z是平行關係,即xabc,yabc,zabc都可以是匹配結果 表示除了中括號內的元素以外都能匹配 任意匹配元字元 邊界限制元字元 限定符 模式選擇符 a b時a和b都可以作為匹配模式 模式單元符 將一些原子組合成大原子使用 使用 re.符號 的方式作為引數加入到函...