正規表示式學習筆記 基礎知識

2022-05-11 17:29:22 字數 1922 閱讀 4578

一、正規表示式-簡介

1. 概念

正規表示式,描述了一種字串匹配的模式,可以用來檢查乙個串是否含有某種子串、將匹配的子串做替換或者從某個串中取出符合某個條件的子串等。

2. 特點

(1) 靈活性、邏輯性和功能性非常的強;

(2)可以迅速地用極簡單的方式達到字串的複雜控制。

(3)對於剛接觸的人來說,比較晦澀難懂。

由於正規表示式主要應用物件

是文字,因此它在各種文字編輯器

場合都有應用,小到著名編輯器editplus,大到microsoft word、visual studio等大型編輯器,都可以使用正規表示式來處理文字內容。

二、正規表示式-元字元

1. 普通字元

普通字元包括沒有顯式指定為元字元的所有可列印和不可列印字元。這包括所有大寫和小寫字母、所有數字、所有標點符號和一些其他符號。

2. 非列印字元

\cx         

匹配 x 指示的控制字元。例如,\cm 匹配 control-m 或回車符。x 的值必須在 a-z 或 a-z 之間。如果不是這樣,則假定 c 就是「c」字元本

\f匹配乙個換頁符。等價於\x0c和\cl

\n匹配乙個換行符。等價於\x0a和\cj

\r匹配乙個回車符。等價於\x0d和\cm

\s匹配任何空白字元,包括空格、製表符、換頁符等。與 [ \f\n\r\t\v] 等效。

\s匹配任何非空白字元。與 [^ \f\n\r\t\v] 等效。

\t製表符匹配。與 \x09 和 \ci 等效。

\v垂直製表符匹配。與 \x0b 和 \ck 等效。

\w匹配任何字類字元,包括下劃線。與「[a-za-z0-9_]」等效。

\w與任何非單詞字元匹配。與「[^a-za-z0-9_]」等效。

\xn匹配 n,此處的 n 是乙個十六進製制轉義碼。十六進製制轉義碼必須正好是兩位數長。例如,「\x41」匹配「a」。「\x041」與「\x04」&「1」等效。允許在正規表示式中使用 ascii **。

3. 特殊字元

所謂特殊字元,就是一些有特殊含義的字元。若要匹配這些特殊字元,必須首先使字元"轉義",即,將反斜槓字元 (\) 放在它們前面。

4. 限定字元

限定符用來指定正規表示式的乙個給定元件必須要出現多少次才能滿足匹配。有*或+或?或或或共6種。

5. 定位符

定位符用來描述字串或單詞的邊界,^和$分別指字串的開始與結束,\b描述單詞的前或後邊界,\b表示非單詞邊界。

6. 選擇

用圓括號將所有選擇項括起來,相鄰的選擇項之間用|分隔。

7. 反向引用

在正則中,當我們需要匹配兩個或多個連續的相同的字元的時候,就需要用到反向引用了,查詢連續重複的字元是反向引用最簡單卻也是最有用的應用之一。

正規表示式 基礎知識學習

特點組成 元字元常用案例 正規表示式最初是科學家對人類神經系統的工作原理進行研究,目前在程式語言中得到廣泛運用 正規表示式通常被用來檢索 替換 選取那些符合某個模式 規則 的文字 正規表示式是對字串操作的一種邏輯公式,用事先定義好的一些特定字元 以及這些特定字元的組合,組成乙個 規則字串 這個 規則...

正規表示式基礎知識

我們先從簡單的開始。假設你要搜尋乙個包含字元 cat 的字串,搜尋用的正規表示式就是 cat 如果搜尋對大小寫不敏感,單詞 catalog catherine sophisticated 都可以匹配。也就是說 1.1 句點符號 假設你在玩英文拼字遊戲,想要找出三個字母的單詞,而且這些單詞必須以 t ...

正規表示式基礎知識

乙個正規表示式就是由普通字元 例如字元 a 到 z 以及特殊字元 稱為元字元 組成的文字模式。該模式描述在查詢文字主體時待匹配的乙個或多個字串。正規表示式作為乙個模板,將某個字元模式與所搜尋的字串進行匹配。如 jscript vbscript 匹配 t t 匹配乙個空白行。d d d d 驗證乙個i...