正規表示式主要作用:分割、匹配、查詢、替換
正規表示式中包括的元素:
1.原子(普通字元:a-z a-z 0-9 、原子表、轉義字元)
2.元字元(有特殊功能的字元)
3.修正模式符(系統內建部分字元,例如:i、m、s、u)
原子 1. a-z a-z 0-9 //最常見的字元
2. (abc) //用圓括號包含起來的單元符號,匹配圓括號整體
3.[abc] //用方括號包含的原子表,匹配方括號中單個字元
4.[^abc] //用方括號包含的原子表,匹配除方括號中字元外的任意字元
5.轉義字元:
\d //包含所有數字 [0-9]
\d //除所有數字外 [^0-9]
\w //包含所有英文本元 [a-z a-z _ 0-9]
\w //除所有定義字元外 [^a-z a-z _ 0-9]
\s //匹配乙個不可見原子 例如:[\f\n\r\t\v]
\s //匹配乙個可見原子 例如:[^\f\n\r\t\v]
元字元:
*//匹配前乙個內容的0次或者多次
.//匹配內容的0次或者多次,但不包含換行(\n)
+//匹配前乙個內容的1次或者多次
?//匹配前乙個內容的0次或者1次
|//選擇匹配類似php中的|(因為這個運算符號是弱型別,導致前面最為整體匹配),多個選擇乙個匹配
^//匹配字串首部內容
$//匹配字串尾部內容
\b//匹配單詞邊界,邊界可以是空格或者特殊符號
\b//匹配單詞邊界以外內容
//匹配前乙個內容重複次數為m次
//匹配前乙個內容重複次數至少為m次
//匹配前乙個內容重複次數從m到n此
修正模式符:
是正規表示式的乙個增強和補充功能,使用在正則之外,格式/正則/修正模式符
i//正則內容在匹配時不區分大小寫(預設區分)
m//在匹配首內容(^)或者尾部(&)時,採用多行識別匹配,注意:^與$物件是段落的首與尾,而模式修正符m的物件是每一行的句首與句尾
s//將轉義回車(\n)取消,為了單行匹配,如 .匹配時,(.*)
x//忽略正則中的空白
a//強制從頭開始匹配
d//強制$匹配尾部無任何內容(\n)
u//禁止貪婪匹配,只跟蹤到最近的乙個匹配符並結束,常用在採集程式上的正規表示式
技巧:
1.圓括號使用技巧:$mode = '/(a)(b)\\1\\2'; \\1表示(a),\\2表示(b),在處理正則時,圓括號被寫入記憶體中,而\\是讀取圓括號在記憶體中存放位置,其位置以1開始
2. .*表示匹配所有字元,除換行符(\n)外
3. \w+表示匹配多個隨機英文本元
正則除錯工具使用:regexpal (
正規表示式詳解
正規表示式 基本正規表示式主要用於grep,egrep,vi,sed,awk命令中進行字串匹配。符號 意義 c 匹配字母c 匹配任意單個字元 匹配前乙個字元出現零次或多次 匹配任意多個任意字元 匹配集合中的任意單個字元,括號中為乙個集合 x y 匹配連續的字串範圍 匹配字串的開頭 匹配字串的結尾 匹...
正規表示式詳解
正規表示式 regular expression 又稱正規表示式 規則表示式等,是電腦科學的乙個概念。正規表示式使用單個字串來描述 匹配一系列匹配某個句法規則的字串,也通常用來檢索 替換那些匹配某個模式的文字。下面從以下方面開始講述正規表示式在python中的應用。1.在python中使用,首先需要...
詳解正規表示式
c 字元c 0n 八進位制0n代表的字元 0 n 7 0nn 八進位制0nn代表的字元 0 n 7 0mnn 八進位制0mnn代表的字元 0 m 3,0 n 7 xnn 十六進製制 0xnn所代表的字元 uhhhh 十六進製制 0xhhhh所代表的字元 t製表符 n換行符 r回車符 f換頁符 a報警...