1、正規表示式中包括的元素
(1)、原子(普通字元:a-z a-z 0-9 、原子表、 轉義字元)
(2)、元字元 (有特殊功能的字元)
(3)、模式修正符 (系統內建部分字元 i 、m、s、u…)
2、正規表示式中的「原子」
①a-z a-z _ 0-9 //最常見的字元
②(abc) (skd) //用圓括號包含起來的單元符合
③[abcs] [^abd] //用方括號包含的原子表,原子表中的^代表排除或相反內容
④轉義字元
\d 包含所有數字[0-9]
\d 除所有數字外[^0-9]
\w 包含所有英文本元[a-za-z_0-9]
\w 除所有英文本元外[^a-za-z_0-9]
\s 包含空白區域如回車、換行、分頁等 [\f\n\r]
3、正規表示式元字元
* 匹配前乙個內容的0次1次或多次
. 匹配內容的0次1次或多次,但不包含回車換行
+ 匹配前乙個內容的1次或多次
?匹配前乙個內容的0次或1次
| 選擇匹配類似php中的| (因為這個運算符合是弱型別導致前面最為整體匹配)
^ 匹配字串首部內容
$ 匹配字串尾部內容
\b 匹配單詞邊界,邊界可以是空格或者特殊符合
\b 匹配除帶單詞邊界意外內容
匹配前乙個內容的重複次數為m次
匹配前乙個內容的重複次數大於等於m次
匹配前乙個內容的重複次數m次到n次
( ) 合併整體匹配,並放入記憶體,可使用\1 \2…依次獲取
4、模式修正符
模式修正符是為正規表示式增強和補充的乙個功能,使用在正則之外
常用修正符
i 正則內容在匹配時候不區分大小寫(預設是區分的)
m 在匹配首內容或者尾內容時候採用多行識別匹配
s 將轉義回車取消是為單行匹配如. 匹配的時候
x 忽略正則中的空白
a 強制從頭開始匹配
d 強制$匹配尾部無任何內容 \n
u 禁止貪婪匹配 只跟蹤到最近的乙個匹配符並結束,常用在採集程式上的正規表示式
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...