常用的正規表示式小結

2022-02-24 22:35:24 字數 2465 閱讀 8777

常用的正規表示式及符號詮釋在指令碼程式的寫作中,正規表示式是經常用到的,但是正規表示式書寫困難,可讀性很差也是大家所知道的,今天寫email的正規表示式時,由於經常寫不對,後來決定gg一下,看看網上有沒有現成的,結果發現網上已經提供了很多的常用的正規表示式了,不需要自己寫的,而且應該是驗證過的吧。

匹配中文字元的正規表示式: [\u4e00-\u9fa5]

匹配雙位元組字元(包括漢字在內):[^\x00-\xff]

匹配空行的正規表示式:\n[\s| ]*\r

匹配html標記的正規表示式:/<(.*)>.*<\/\1>|<(.*) \/>/

匹配首尾空格的正規表示式:(^\s*)|(\s*$)

匹配email位址的正規表示式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配**url的正規表示式:^[a-za-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\s*)?$

下表是元字元及其在正規表示式上下文中的行為的乙個完整列表:

\ 將下乙個字元標記為乙個特殊字元、或乙個原義字元、或乙個後向引用、或乙個八進位制轉義符。

^ 匹配輸入字串的開始位置。如果設定了 regexp 物件的multiline 屬性,^ 也匹配 』\n』 或 』\r』 之後的位置。

$ 匹配輸入字串的結束位置。如果設定了 regexp 物件的multiline 屬性,$ 也匹配 』\n』 或 』\r』 之前的位置。

* 匹配前面的子表示式零次或多次。

+ 匹配前面的子表示式一次或多次。+ 等價於 。

? 匹配前面的子表示式零次或一次。? 等價於 。

n 是乙個非負整數,匹配確定的n 次。

n 是乙個非負整數,至少匹配n 次。

m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。

? 當該字元緊跟在任何乙個其他限制符 (*, +, ?, , , ) 後面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜尋的字串,而預設的貪婪模式則盡可能多的匹配所搜尋的字串。

. 匹配除 "\n" 之外的任何單個字元。要匹配包括 』\n』 在內的任何字元,請使用象 』[.\n]』 的模式。

(pattern) 匹配pattern 並獲取這一匹配。

(?:pattern) 匹配pattern 但不獲取匹配結果,也就是說這是乙個非獲取匹配,不進行儲存供以後使用。

(?=pattern) 正向預查,在任何匹配 pattern 的字串開始處匹配查詢字串。這是乙個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。

(?!pattern) 負向預查,與(?=pattern)作用相反

x|y 匹配 x 或 y。

[xyz] 字元集合。

[^xyz] 負值字元集合。

[a-z] 字元範圍,匹配指定範圍內的任意字元。

[^a-z] 負值字元範圍,匹配任何不在指定範圍內的任意字元。

\b 匹配乙個單詞邊界,也就是指單詞和空格間的位置。

\b 匹配非單詞邊界。

\cx 匹配由x指明的控制字元。

\d 匹配乙個數字字元。等價於 [0-9]。

\d 匹配乙個非數字字元。等價於 [^0-9]。

\f 匹配乙個換頁符。等價於 \x0c 和 \cl。

\n 匹配乙個換行符。等價於 \x0a 和 \cj。

\r 匹配乙個回車符。等價於 \x0d 和 \cm。

\s 匹配任何空白字元,包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。

\s 匹配任何非空白字元。等價於 [^ \f\n\r\t\v]。

\t 匹配乙個製表符。等價於 \x09 和 \ci。

\v 匹配乙個垂直製表符。等價於 \x0b 和 \ck。

\w 匹配包括下劃線的任何單詞字元。等價於』[a-za-z0-9_]』。

\w 匹配任何非單詞字元。等價於 』[^a-za-z0-9_]』。

\xn 匹配 n,其中 n 為十六進製制轉義值。十六進製制轉義值必須為確定的兩個數字長。

\num 匹配 num,其中num是乙個正整數。對所獲取的匹配的引用。

\n 標識乙個八進位制轉義值或乙個後向引用。如果 \n 之前至少 n 個獲取的子表示式,則 n 為後向引用。否則,如果 n 為八進位制數字 (0-7),則 n 為乙個八進位制轉義值。

\nm 標識乙個八進位制轉義值或乙個後向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表示式,則 nm 為後向引用。如果 \nm 之前至少有 n 個獲取,則 n 為乙個後跟文字 m 的後向引用。如果前面的條件都不滿足,若 n 和 m 均為八進位制數字 (0-7),則 \nm 將匹配八進位制轉義值 nm。

\nml 如果 n 為八進位制數字 (0-3),且 m 和 l 均為八進位制數字 (0-7),則匹配八進位制轉義值 nml。

\un 匹配 n,其中 n 是乙個用四個十六進製制數字表示的unicode字元。

fei 正規表示式 正規表示式小結

常用的元字元常用的反義 常用的限定符 語法 說明 語法 說明 語法 說明 w 匹配字母或數字或下劃線或漢字 w匹配任意不是字母 數字 下劃線 漢字的字元 重複零次或者更多次 s匹配任意的空白字元 s匹配任意不是空白符的字元 重複一次或更多次 d匹配數字 d匹配任意非數字的字元 重複零次或一次 b匹配...

正規表示式小結

正規表示式 regex 英 red eks 1,d d d d或者是 d 表示匹配4位數的數字。2.說明。這些可被稱作元字元。匹配除換行符以外的任意字元1 jk2yh jj w數字字母漢字下劃線 bst456 5ghgtft s匹配任意的空白符 space table鍵和半全形空格 d匹配數字 di...

正規表示式小結

最近學習了正規表示式,趁還熱乎,寫下這篇部落格,記錄一下。正規表示式 英語 regular expression,在 中常簡寫為regex 正規表示式是乙個字串,使用單個字串來描述 用來定義匹配規則,匹配一系列符合某個句法規則的字串。在開發中,正規表示式通常被用來檢索 替換那些符合某個規則的文字,也...