正規表示式詳解

正規表示式主要作用：分割、匹配、查詢、替換

正規表示式中包括的元素：

1.原子（普通字元：a-z a-z 0-9 、原子表、轉義字元）

2.元字元（有特殊功能的字元）

3.修正模式符（系統內建部分字元，例如：i、m、s、u）

原子 1. a-z a-z 0-9 //最常見的字元

2. (abc) //用圓括號包含起來的單元符號，匹配圓括號整體

3.[abc] //用方括號包含的原子表，匹配方括號中單個字元

4.[^abc] //用方括號包含的原子表，匹配除方括號中字元外的任意字元

5.轉義字元：

\d //包含所有數字 [0-9]

\d //除所有數字外 [^0-9]

\w //包含所有英文本元 [a-z a-z _ 0-9]

\w //除所有定義字元外 [^a-z a-z _ 0-9]

\s //匹配乙個不可見原子例如：[\f\n\r\t\v]

\s //匹配乙個可見原子例如：[^\f\n\r\t\v]

元字元：

*//匹配前乙個內容的0次或者多次

.//匹配內容的0次或者多次，但不包含換行(\n）

+//匹配前乙個內容的1次或者多次

?//匹配前乙個內容的0次或者1次

|//選擇匹配類似php中的|（因為這個運算符號是弱型別，導致前面最為整體匹配），多個選擇乙個匹配

^//匹配字串首部內容

$//匹配字串尾部內容

\b//匹配單詞邊界，邊界可以是空格或者特殊符號

\b//匹配單詞邊界以外內容

//匹配前乙個內容重複次數為m次

//匹配前乙個內容重複次數至少為m次

//匹配前乙個內容重複次數從m到n此

修正模式符：

是正規表示式的乙個增強和補充功能，使用在正則之外，格式/正則/修正模式符

i//正則內容在匹配時不區分大小寫（預設區分）

m//在匹配首內容(^)或者尾部(&)時，採用多行識別匹配，注意：^與$物件是段落的首與尾，而模式修正符m的物件是每一行的句首與句尾

s//將轉義回車(\n)取消，為了單行匹配，如 .匹配時，(.*)

x//忽略正則中的空白

a//強制從頭開始匹配

d//強制$匹配尾部無任何內容(\n)

u//禁止貪婪匹配，只跟蹤到最近的乙個匹配符並結束，常用在採集程式上的正規表示式

技巧：

1.圓括號使用技巧：$mode = '/(a)(b)\\1\\2'; \\1表示(a)，\\2表示(b)，在處理正則時，圓括號被寫入記憶體中，而\\是讀取圓括號在記憶體中存放位置，其位置以1開始

2. .*表示匹配所有字元，除換行符(\n)外

3. \w+表示匹配多個隨機英文本元

正則除錯工具使用：regexpal （

正規表示式詳解

正規表示式基本正規表示式主要用於grep，egrep，vi，sed，awk命令中進行字串匹配。符號意義 c 匹配字母c 匹配任意單個字元匹配前乙個字元出現零次或多次匹配任意多個任意字元匹配集合中的任意單個字元，括號中為乙個集合 x y 匹配連續的字串範圍匹配字串的開頭匹配字串的結尾匹...

正規表示式詳解

正規表示式 regular expression 又稱正規表示式規則表示式等，是電腦科學的乙個概念。正規表示式使用單個字串來描述匹配一系列匹配某個句法規則的字串，也通常用來檢索替換那些匹配某個模式的文字。下面從以下方面開始講述正規表示式在python中的應用。1.在python中使用，首先需要...

詳解正規表示式

c 字元c 0n 八進位制0n代表的字元 0 n 7 0nn 八進位制0nn代表的字元 0 n 7 0mnn 八進位制0mnn代表的字元 0 m 3,0 n 7 xnn 十六進製制 0xnn所代表的字元 uhhhh 十六進製制 0xhhhh所代表的字元 t製表符 n換行符 r回車符 f換頁符 a報警...

正規表示式詳解

正規表示式詳解

正規表示式詳解

詳解正規表示式

相關推薦