正規表示式就是由普通字元以及特殊字元(稱為元字元)組成的文字模式
。該模式描述在查詢文字主體時待匹配的乙個或多
個字串
1.特殊符號元字元
元字元 描述
1 @符號
正規表示式字串前面加上
@字元,這樣不讓編譯器去解析其中的轉義字元 2
*符號
*代表0-多個字元 3
\符號
\是轉義字元
. *是元字元,如果要表示乙個
\ .
字元的話
,需要使用
\\ \. \4
| 將兩個匹配條件進行邏輯「或
」(or)運算。
5 ( )
用小括號來指定子表示式
(也叫做分組)
2.定位元字元
元字元 描述
1 \b
匹配單詞的開始或結束 2
\b匹配非單詞的開始或結束 3
^匹配必須出現在字串的開頭或行的開頭 4
$匹配必須出現在以下位置
:字串結尾
、字串結尾處的
\n之前或行的結尾。
5 \a
指定匹配必須出現在字串的開頭(忽略
multiline
選項)。 6
\z指定匹配必須出現在字串的結尾(忽略
multiline
選項)。 7
\z指定匹配必須出現在字串的結尾或字串結尾處的
\n之前(忽略
multiline
選項)。 8
\g定匹配必須出現在上乙個匹配結束的地方。與
match.nextmatch()
一起使用時,此斷言確保所有匹配都
是連續的。
3.基本語法元字元
元字元 描述
1 .匹配除換行符以外的任意字元 2
\w匹配字母、數字
、下劃線、漢字
(指大小寫字母
、0-9
的數字、
下劃線_) 3
\w \w
的補集(除
「大小寫字母
、0-9
的數字、
下劃線_」
之外) 4
\s 匹配任意空白符
(包括換行符/n、
回車符/r
、製表符/t、
垂直製表符/v、
換頁符/f) 5
\s \s
的補集 (除
\s定義的字元之外)
6 \d
匹配數字
(0-9數字)
7 \d
表示\d的補集(除
0-9數字之外)
4.反義字元
元字元 描述
1[ab]
匹配中括號中的字元 2
[a-c] a
字元到c
字元之間是字元 3
[^x]
匹配除了
x以外的任意字元 4
[^adwz]
匹配除了
adwz
這幾個字元以外的任意字元
5.重複描述字元
元字元 描述
1 匹配前面的字元n次
2 匹配前面的字元
n次或多於n次
3 匹配前面的字元n到
m次 4
?重複零次或一次 5
+重複一次或更多次 6
*重複零次或更多次
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...