定義:一種匹配字串的規則。
作用範圍:只能用於處理字串。
正規表示式能做什麼?
a.可以制定乙個規則
1、來確認某乙個字串是否符合規則
2、從大段的字串中找到符合規則的內容
b.程式領域
登入註冊頁的表單驗證
爬蟲c.自動化開發
日誌開發
元字元[ ] 字元組 [0-9] = \d
[a-z] [a-z]
[0-9a-za-z] 不能倒著寫
\s 空白符 (空格、回車、製表符)
\s 匹配非空白
\d 匹配所有的數字
\d 匹配所有的非數字
\w 匹配數字字母下劃線
\w 匹配所有非數字字母下劃線
\t 製表符
\n 換行符
[\d\d] [\w\w] [\s\s] 都表示所有
[^a] 匹配除了a以外的其他
^ 匹配字串的開始
$ 匹配字串的結尾
a|b 匹配 a 或 b 前邊放的是長的,後邊是短的 比如 abc | ab 而不能是 ab | abc
. 匹配除了換行符以外的所有
量詞? 匹配0次 或 1 次
+ 匹配1次或多次
* 匹配0次或多次
() 表示分組 將括號裡的內容看成乙個整體。
貪婪匹配
在滿足匹配時,匹配盡可能長的字串,預設情況下,採用貪婪匹配
\d 匹配 2 個 數字
\d 匹配最少 2 個 數字 預設到正無窮
\d 匹配2個至5個數字 預設從大的開始計算
回朔演算法 每個字元從前往後匹配,匹配不到從後往前匹配,匹配到就結束。
量詞後邊+ ? 表示結束貪婪匹配採取惰性匹配,匹配盡可能短的。
?.*?x 表示匹配任意字元,直到找到乙個x
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...