正規表示式練習 - github
正規表示式
"正規表示式" - 一組由字母和符號組成的特殊文字,可以用來從文字中找出滿足你想要的格式的句子。
元字元
" . " - 句號匹配任意單個字元,除了換行符。
- 字元種類,匹配方括號內的任意字元。
[^] - 否定的字元種類,匹配除了方括號內的任意字元。
" * " - 匹配 >=0 個重複的,在 * 號之前的字元。
" + " - 匹配 >= 1 個重複的,在 + 號之前的字元。
" ? " - 標記 ? 之前的字元為可選的,匹配 1 或 0 個。
- 匹配 [n,m] 個 大括號之前的字元
a. b.
(xyz) - 字符集,匹配與 xyz 完全相等的字串。
" | " - 與運算子
" \ " - 轉移字元,用於匹配保留字。
" ^ " - 從開始行開始匹配
" & " - 從末端開始匹配
簡寫字符集
\w - 匹配所有字元(大小寫)、數字,等同於 [a-za-z0-9_]
\w - 匹配所有非字母數字,等同於 [^\w]
\d - 匹配所有數字,[0-9]
\d - 匹配所有非數字,[^0-9]
\s - 匹配所有空格字元
\s - 匹配所有非空格字元,[^\s]
\f - 匹配乙個換頁符
\n - 匹配乙個換行符
\r - 匹配乙個回車符
\t - 匹配乙個製表符
\v - 匹配乙個垂直製表符
\p - 匹配 cr/lf(等同於 \r\n),用來匹配 dos 行終止符
零寬度斷言(前後預查)
"?=" - 正先行斷言(存在)
"?!" - 負先行斷言(排除)
"?<=" - 正後發斷言(存在)
"?標誌
i - 忽略大小寫
g - 全域性搜尋
m - 多行的: 錨點元字元 ^ $ 工作範圍在每行的起始
貪婪匹配與惰性匹配
正規表示式預設採用貪婪匹配模式,在該模式下意味著會匹配盡可能長的子串。我們可以使用 ? 將貪婪匹配模式轉化為惰性匹配模式。
貪婪 => 惰性 = "/(.*at)/" => "/(.*?at)/"
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...