小結正規表示式是一組由字母、數字和符號組成的特殊文字, 它可以用來從文字中找出滿足你想要的格式的字元。簡單的說,正規表示式就是對字串操作的一種邏輯公式。
概念解析:
1、它是一種邏輯公式;
2、一種對字串操作的邏輯公式;
3、對字串的一種過濾,搜尋符合限定條件(即邏輯公式)的字串。
正規表示式其實就是在執行搜尋時的格式, 它由一些字母和數字組合而成。例如: 乙個正規表示式 the,它表示乙個規則:由字母t開始,接著是h,再接著是e,匹配的就是其中的』the』。
"the" => the fat cat sat on *the* mat.
占有字元:正規表示式匹配到的東西,不是乙個位置,而且能儲存到匹配的結果當中,這樣的就叫做占有字元。
零寬度:只匹配乙個位置,或者匹配的內容並不儲存到匹配結果中,就稱作零寬度。
正規表示式主要依賴於元字元,元字元不代表他們本身的字面意思,他們都有特殊的含義,一些元字元寫在方括號中的時候有一些特殊的意思。以下是一些元字元的介紹:
元字元描述
.匹配除換行符以外的任意字元
[ ]字元種類. 匹配方括號內的任意字元
[ ^]
否定的字元種類. 匹配除了方括號裡的任意字元
\b匹配單詞開始或結束,它只是匹配乙個位置
^錨點,匹配字串開始
$錨點,匹配字串結束
轉義字元是專門用在元字元身上的,如果你想要得到元字元本身的話需要使用\來取消這些元字元的特殊意義。
首先字元型別是用""包括起來,而且大小寫要區分。
例子:[a-za-z0-9] 這個正規表示式表示:匹配乙個字元,這個字元可以是a-z範圍內或者a-z範圍內或者0-9範圍內的任意小寫或者大寫或數字的字元。
[abc]這個表示:匹配乙個字元,這個字元可以是a,可以是b,也可以是c。
元字元描述
*匹配》=0個重複的在*號之前的字元
+匹配》=1個重複的+號前的字元
?重複0或1次
重複n次
重複至少n次
重複最少n次,最多m次
指的是有幾種規則:用「|」把不同的規則分開
例子:[a]|[b]|[c]|[d] 匹配乙個字元:這個字元可以是a或b或c或d
使用小括號()來指定字表示式:
例子:(\d)\d 表示:把我們分組的小括號裡面的東西重複三次,也就是說我們至少匹配3個最多匹配9個數字,後面再加上三個數字
簡寫描述
\w匹配所有字母數字, 等同於 [a-za-z0-9_]
\w匹配所有非字母數字, 即符號, 等同於: [^\w]
\d匹配數字: [0-9]
\d匹配非數字: [^\d]
\s匹配所有空格字元, 等同於: [\t\n\f\r\p]
\s匹配所有非空格字元: [^\s]
\f匹配乙個換頁符
\n匹配乙個換行符
\r匹配乙個回車符
\t匹配乙個製表符
\v匹配乙個垂直製表符
\p匹配 cr/lf (等同於 \r\n),用來匹配 dos 行終止符
標誌也叫模式修正符, 因為它可以用來修改表示式的搜尋結果. 這些標誌可以任意的組合使用, 它也是整個正規表示式的一部分。
標誌描述
i忽略大小寫
g全域性搜尋
m多行的;錨點元素^ $工作範圍在每行的起始
正規表示式就像是在高考完大學錄取學生一樣:有的學校要省內的,有的學校要省外的;有的學校收普通學生,而有的學校可能只收藝術特長生;有的學校要分數高的,有的學校還是想要分數高的,開個小玩笑哈。正規表示式就是在匹配字串的過程中加一些限制條件,然後選出適合的,中意的。
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...