正規表示式 學習筆記

2021-06-08 07:13:54 字數 1602 閱讀 1120

1.匹配可選字元——使用?    匹配color或colour:colou?r

2.?匹配零次或一次,*匹配零次或多次,+匹配一次或多次

3.匹配n次,匹配n到m次,匹配n到無限次

4.句點(.)元字元匹配任何字母字元(無論大小寫),也可以匹配數字、空白字元(如空格符)以及非英語語言中的很多文字字元。多數情況下,它都會匹配除了換行符之外的任何字元。然而也可以通過修改.元字元的這種匹配特性使其匹配換行符。若要匹配目標文件中的乙個句點,則需使用反斜槓轉義

5.\w匹配英文本母字元、數字、下劃線;\w匹配\w不匹配的字元;\d匹配數字;\d匹配非數字;\s匹配任何單個的空白字元(空格符、製表符\t、換行符\n);\s匹配任何非空白字元,但不像句點元字元(根據設定,它會匹配除換行符之外的任何可能的字元)那樣會匹配盡可能多的字元

6.匹配文字中的反斜槓字元用\\

7.[cd]等價於(c|d),匹配文字中的方括號需要進行轉義 \[  \]

8.在字元類的內部,\b元字元表示乙個回格符,在字元類外部表示乙個詞邊界

9.-表示範圍 [a-z]匹配a-z,a-z,並且還匹配z到a中間的字元(非字母)。若不想用連字元-表示範圍,那麼連字元應該作為字元類中的第乙個字元

10.^元字元,也稱脫字元,當它是字元類中左方括號後面的第乙個字元時,表示的是方括號中指定的任何字元都不能匹配的情況。如果^元字元不作為方括號中的第乙個字元出現,而是出現在其他任何位置上,它的含義都是直接量本身——即匹配^字元。

11.[a-z&&[^b-d]]匹配處於範圍a-z之間並且不在範圍b-d之間的字元

12.^元字元用於字元類之外時,匹配位於一行或乙個字串開始位置後的目標字元,$正好相反,通過$元字元可以指定出現在乙個檔案結束位置或檔案中一行結束位置之前的字串行。匹配表示美元的符號$時需使用轉義\$

13.使用多行模式的情況下,下一行的開始位置會與測試檔案的開始位置等同

14.^$ 匹配空白行

15.\《元字元用於識別位於乙個詞開始位置的詞邊界,它的前面是乙個非字母字元(比如乙個空格符)或者是一行的開始位置;\>元字元表示位於乙個字母字串行結尾處的詞邊界;\b元字元既可以用於匹配位於詞開始處的詞邊界也可以用於匹配詞結尾處的詞邊界。\b元字元匹配乙個非詞邊界的位置

16.圓括號可以對字元進行分組,並儲存匹配的文字。乙個基本用法是對字元或元字元進行分組,這樣在括號內可以對字元組合使用限定符。匹配直接量需要用\(和\)。圓括號還可以表示可選擇性(使用()和|)。圓括號可以定義乙個組,這個組模式匹配的內容**獲並指定給變數,在使用巢狀的圓括號時,變數的編號會按照模式中圓開括號出現的位置依次進行。建立命名的組:(?《組名》模式)或(?'組名'模式)。非捕獲圓括號的模式:(?:模式).

17.反向引用:使用\1 \2...引用第乙個 第二個……變數(圓括號指定的)

18.(?元字元  (?:...)非捕獲組  (?=...)肯定式向前查詢  (?!...)否定式向前查詢  (?<=...)肯定式向後查詢  (?19.向前查詢根據要匹配的字串行後面存在乙個特定的字串行或者不存在乙個特定的字串行來決定是否匹配(實際上向前查詢指的是乙個子模式,這個子模式匹配特定字串行,但不返回匹配結果。所以從本質上來說向前查詢子模式匹配的是測試文字中的位置。所謂向前也是基於這個位置而言的。向前查詢也就是向左、向文字中先出現的字串行中查詢要匹配並返回結果的字串行)

正規表示式學習筆記

正規表示式學習日記 1 為萬用字元,表示任何乙個字元,例如 a.c 可以匹配 anc abc acc 2 在內可以指定要求匹配的字元,例如 a nbc c 可以匹配 anc abc acc 但不可以匹配 ancc a到z可以寫成 a z 0到9可以寫成 0 9 3 數量限定符號,表示匹配次數 或者叫...

正規表示式學習筆記

字元描述 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

正規表示式學習筆記

1.正規表示式是可用於在乙個檔案或字元裡查詢和替代文字的一種標準。它具有兩種標準 基本的正規表示式 bre 擴充套件的正規表示式 ere ere包括bre功能和另外其它的概念。2.表示或運算 3.匹配任何單個字元 4.匹配任何中包含的單個字元,如 張王李 三,匹配張 三 王三,李三 5.將排除 後跟...