正規表示式

2021-09-27 02:21:25 字數 1350 閱讀 2068

正規表示式練習 - github

正規表示式

"正規表示式" - 一組由字母和符號組成的特殊文字,可以用來從文字中找出滿足你想要的格式的句子。
元字元

" . " - 句號匹配任意單個字元,除了換行符。

- 字元種類,匹配方括號內的任意字元。

[^] - 否定的字元種類,匹配除了方括號內的任意字元。

" * " - 匹配 >=0 個重複的,在 * 號之前的字元。

" + " - 匹配 >= 1 個重複的,在 + 號之前的字元。

" ? " - 標記 ? 之前的字元為可選的,匹配 1 或 0 個。

- 匹配 [n,m] 個 大括號之前的字元

a. b.

(xyz) - 字符集,匹配與 xyz 完全相等的字串。

" | " - 與運算子

" \ " - 轉移字元,用於匹配保留字。

" ^ " - 從開始行開始匹配

" & " - 從末端開始匹配

簡寫字符集

\w - 匹配所有字元(大小寫)、數字,等同於 [a-za-z0-9_]

\w - 匹配所有非字母數字,等同於 [^\w]

\d - 匹配所有數字,[0-9]

\d - 匹配所有非數字,[^0-9]

\s - 匹配所有空格字元

\s - 匹配所有非空格字元,[^\s]

\f - 匹配乙個換頁符

\n - 匹配乙個換行符

\r - 匹配乙個回車符

\t - 匹配乙個製表符

\v - 匹配乙個垂直製表符

\p - 匹配 cr/lf(等同於 \r\n),用來匹配 dos 行終止符

零寬度斷言(前後預查)

"?=" - 正先行斷言(存在)

"?!" - 負先行斷言(排除)

"?<=" - 正後發斷言(存在)

"?標誌

i - 忽略大小寫

g - 全域性搜尋

m - 多行的: 錨點元字元 ^ $ 工作範圍在每行的起始

貪婪匹配與惰性匹配

正規表示式預設採用貪婪匹配模式,在該模式下意味著會匹配盡可能長的子串。我們可以使用 ? 將貪婪匹配模式轉化為惰性匹配模式。

貪婪 => 惰性 = "/(.*at)/" => "/(.*?at)/"

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...