正規表示式 學習

2021-09-04 11:49:01 字數 3381 閱讀 3735

下表是元字元及其在正規表示式上下文中的行為的乙個完整列表:

\ 將下乙個字元標記為乙個特殊字元、或乙個原義字元、或乙個後向引用、或乙個八進位制轉義符。

^ 匹配輸入字串的開始位置。如果設定了 regexp 物件的multiline 屬性,^ 也匹配 』\n』 或 』\r』 之後的位置。

$ 匹配輸入字串的結束位置。如果設定了 regexp 物件的multiline 屬性,$ 也匹配 』\n』 或 』\r』 之前的位置。

* 匹配前面的子表示式零次或多次。

+ 匹配前面的子表示式一次或多次。+ 等價於 。

? 匹配前面的子表示式零次或一次。? 等價於 。

n 是乙個非負整數,匹配確定的n 次。

n 是乙個非負整數,至少匹配n 次。

m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。

? 當該字元緊跟在任何乙個其他限制符 (*, +, ?, , , ) 後面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜尋的字串,而預設的貪婪模式則盡可能多的匹配所搜尋的字串。

. 匹配除 "\n" 之外的任何單個字元。要匹配包括 』\n』 在內的任何字元,請使用象 』[.\n]』 的模式。

(pattern) 匹配pattern 並獲取這一匹配。

(?:pattern) 匹配pattern 但不獲取匹配結果,也就是說這是乙個非獲取匹配,不進行儲存供以後使用。

(?=pattern) 正向預查,在任何匹配 pattern 的字串開始處匹配查詢字串。這是乙個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。

(?!pattern) 負向預查,與(?=pattern)作用相反

x|y 匹配 x 或 y。

[xyz] 字元集合。

[^xyz] 負值字元集合。

[a-z] 字元範圍,匹配指定範圍內的任意字元。

[^a-z] 負值字元範圍,匹配任何不在指定範圍內的任意字元。

\b 匹配乙個單詞邊界,也就是指單詞和空格間的位置。

\b 匹配非單詞邊界。

\cx 匹配由x指明的控制字元。

\d 匹配乙個數字字元。等價於 [0-9]。

\d 匹配乙個非數字字元。等價於 [^0-9]。

\f 匹配乙個換頁符。等價於 \x0c 和 \cl。

\n 匹配乙個換行符。等價於 \x0a 和 \cj。

\r 匹配乙個回車符。等價於 \x0d 和 \cm。

\s 匹配任何空白字元,包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。

\s 匹配任何非空白字元。等價於 [^ \f\n\r\t\v]。

\t 匹配乙個製表符。等價於 \x09 和 \ci。

\v 匹配乙個垂直製表符。等價於 \x0b 和 \ck。

\w 匹配包括下劃線的任何單詞字元。等價於[a-za-z0-9_]。

\w 匹配任何非單詞字元。等價於[^a-za-z0-9_]。

\xn 匹配 n,其中 n 為十六進製制轉義值。十六進製制轉義值必須為確定的兩個數字長。

\num 匹配 num,其中num是乙個正整數。對所獲取的匹配的引用。

\n 標識乙個八進位制轉義值或乙個後向引用。如果 \n 之前至少 n 個獲取的子表示式,則 n 為後向引用。否則,如果 n 為八進位制數字 (0-7),則 n 為乙個八進位制轉義值。

\nm 標識乙個八進位制轉義值或乙個後向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表示式,則 nm 為後向引用。如果 \nm 之前至少有 n 個獲取,則 n 為乙個後跟文字 m 的後向引用。如果前面的條件都不滿足,若 n 和 m 均為八進位制數字 (0-7),則 \nm 將匹配八進位制轉義值 nm。

\nml 如果 n 為八進位制數字 (0-3),且 m 和 l 均為八進位制數字 (0-7),則匹配八進位制轉義值 nml。 \un 匹配 n,其中 n 是乙個用四個十六進製制數字表示的unicode字元。

下面是常用的正規表示式——

驗證數字:^[0-9]*$

驗證n位的數字:^\d$

驗證至少n位數字:^\d$

驗證m-n位的數字:^\d$

驗證零和非零開頭的數字:^(0|[1-9][0-9]*)$

驗證有兩位小數的正實數:^[0-9]+(.[0-9])?$

驗證有1-3位小數的正實數:^[0-9]+(.[0-9])?$

驗證非零的正整數:^\+?[1-9][0-9]*$

驗證非零的負整數:^\-[1-9][0-9]*$

驗證非負整數(正整數 + 0)  ^\d+$

驗證非正整數(負整數 + 0)  ^((-\d+)|(0+))$

驗證長度為3的字元:^.$

驗證由26個英文本母組成的字串:^[a-za-z]+$

驗證由26個大寫英文本母組成的字串:^[a-z]+$

驗證由26個小寫英文本母組成的字串:^[a-z]+$

驗證由數字和26個英文本母組成的字串:^[a-za-z0-9]+$

驗證由數字、26個英文本母或者下劃線組成的字串:^\w+$

驗證使用者密碼:^[a-za-z]\w$ 正確格式為:以字母開頭,長度在6-18之間,只能包含字元、數字和下劃線。

驗證是否含有 ^%&',;=?$\" 等字元:[^%&',;=?$\x22]+

驗證漢字:^[\u4e00-\u9fa5],$

驗證interneturl:^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ ;^[a-za-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?s*)?$

驗證**號碼:^(\(\d\)|\d-)?\d$:--正確格式為:***x-******x,***x-******xx,***-******x,***-******xx,******x,******xx。

驗證身份證號(15位或18位數字):^\d|\d{}18$

驗證一年的12個月:^(0?[1-9]|1[0-2])$ 正確格式為:「01」-「09」和「1」「12」

驗證乙個月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$    正確格式為:01、09和1、31。

整數:^-?\d+$

非負浮點數(正浮點數 + 0):^\d+(\.\d+)?$

正浮點數   ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

非正浮點數(負浮點數 + 0) ^((-\d+(\.\d+)?)|(0+(\.0+)?))$

負浮點數  ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

浮點數  ^(-?\d+)(\.\d+)?$

正規表示式學習

概念 正規表示式,就是用某種模式去匹配一類字串的乙個公式。基礎 下表列出了所有的元字元和對它們的乙個簡短的描述。簡單例子 vi 命令作用 s g 把乙個或者多個空格替換為乙個空格 s 去掉行尾的所有空格 s 在每一行頭上加入乙個空格 s 0 9 0 9 去掉行首的所有數字字元 s b aeio g ...

正規表示式學習

1.元字元 1 匹配任何單個字元 2 匹配括號中的任何乙個字元 可以再括號中使用連字元 來指定子都的區間來簡化表示,如a 0123456789 c等價於a 0 9 c 3 將 之間括起來的表示式定義為 組 4 將兩個匹配條件進行邏輯 或 運算 z f ood則匹配 zood 或 food 5 匹配0...

正規表示式學習

只是點皮毛,先湊合用著了,順便鄙視一下sqlserver,居然不支援正則。b 元字元,代表著單詞的開頭或結尾,也就是單詞的分界處。d 數字 s 任意的空白符,包括空格,製表符 tab 換行符,中文全形空格等 w 字母或數字或下劃線或漢字等 匹配字串的開始 匹配字串的結束 轉義符 除換行符以外的任意字...