正規表示式:正規表示式是對字串操作的一種邏輯公式,就是用實現定義好的一些特定字元、及這些特定字元的組合,組成乙個「規則字串」,這個「規則字串」用來表達對字串的一種過濾邏輯。
字元組:[字元組]
在同一位置可能出現的各種字元組成了乙個字元組,在正規表示式中用表示
字元分為很多類,比如數字、字母、標點等。
[0-9]
匹配數字
[a-z]
匹配小寫字母
[a-z]
匹配大寫字母
[a-za-z]
匹配大小寫字母
[a-za-z0-9]
匹配大小寫字母+數字
[a-za-z0-9_]
匹配數字字母下劃線
元字元:
元字元匹配內容
.匹配除換行符以外的任意字元
\w 匹配字母或數字或下劃線
\s匹配任意的空白符(換行符、製表符、空格)
\d匹配數字
\n匹配乙個換行符
\t匹配乙個製表符
\b匹配乙個單詞的結尾或開頭
^匹配字串的開頭
$匹配字串的結尾
\w匹配非字母數字下換線
\d匹配非數字
\s匹配非空白符
a|b匹配字元a或字元b(將複雜的放在前面)
()匹配括號內的表示式,也表示乙個組
[...]
匹配字元組紅的字元
[^...]
匹配除了字元組中字元的所有字元
量詞:量詞
用法說明
重複n次
重複n次或多次
重複n到m次
?重複1次或0次
+重複1次或多次
*重複0次或多次
正規表示式的匹配特點:貪婪匹配
它會在允許的範圍內取最長的結果
非貪婪模式/惰性匹配:在量詞的後面加上?
.*?x 匹配任意非換行符字元任意長度 直到遇到x就停止
練習:匹配整數:\d+
匹配小數:\d+\.\d+
匹配小數或整數:\d+\.\d+|\d+
\d+(\.\d+)
匹配身份證號碼:[1-9]\d[\dx]|[1-9]\d
[1-9]\d(\d[\dx])?
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...