字元
描述\b
匹配乙個單詞邊界,也就是指單詞和空格間的位置。例如,「er\b」可以匹配「never」中的「er」,但不能匹配「verb」中的「er」。
\b匹配非單詞邊界。「er\b」能匹配「verb」中的「er」,但不能匹配「never」中的「er」。
\cx匹配由x指明的控制字元。例如,\cm匹配乙個control-m或回車符。x的值必須為a-z或a-z之一。否則,將c視為乙個原義的「c」字元。
\d匹配乙個數字字元。等價於[0-9]。
\d匹配乙個非數字字元。等價於[^0-9]。
\f匹配乙個換頁符。等價於\x0c和\cl。
\n匹配乙個換行符。等價於\x0a和\cj。
\r匹配乙個回車符。等價於\x0d和\cm。
\s匹配任何空白字元,包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。
\s匹配任何非空白字元。等價於[^ \f\n\r\t\v]。
\t匹配乙個製表符。等價於\x09和\ci。
\v匹配乙個垂直製表符。等價於\x0b和\ck。
\w匹配包括下劃線的任何單詞字元。等價於「[a-za-z0-9_]」。
\w匹配任何非單詞字元。等價於「[^a-za-z0-9_]」。
\xn匹配n,其中n為十六進製制轉義值。十六進製制轉義值必須為確定的兩個數字長。例如,「\x41」匹配「a」。「\x041」則等價於「\x04&1」。正規表示式中可以使用ascii編碼。.
\num
向後引用(back-reference)乙個子字串(substring),該子字串與正規表示式的第num個用括號圍起來的子表示式(subexpression)匹配。其中num是從1開始的正整數,其上限可能是99。例如:「(.)\1」匹配兩個連續的相同字元。
\n標識乙個八進位制轉義值或乙個向後引用。如果\n之前至少n個獲取的子表示式,則n為向後引用。否則,如果n為八進位制數字(0-7),則n為乙個八進位制轉義值。
\nm標識乙個八進位制轉義值或乙個向後引用。如果\nm之前至少有nm個獲得子表示式,則nm為向後引用。如果\nm之前至少有n個獲取,則n為乙個後跟文字m的向後引用。如果前面的條件都不滿足,若n和m均為八進位制數字(0-7),則\nm將匹配八進位制轉義值nm。
\nml
如果n為八進位制數字(0-3),且m和l均為八進位制數字(0-7),則匹配八進位制轉義值nml。
\un元字元作用*
前乙個字元匹配0次或任意多次
+匹配除了換行符以外任意乙個字元
?匹配中括號裡的任意指定的乙個字元,但只匹配乙個字元
|用於分隔兩匹配的正則塊,x|y等價於[xy],「或」的意思
表示其前面的字元恰好出現n次
表示其前面的字元出現不小於n次
表示其前面的字元至少出現n次,最多出現m次
定位符^
匹配行首。例如:^helloworld會匹配以helloworld開頭的行
$匹配行尾。例如:helloworld$會匹配以helloworld結尾的行
修飾符修飾符作用g
全域性匹配(會查詢所有匹配,不會在查詢到第乙個匹配時就停止)im
例子:萬用字元與正規表示式的區別
基本上解釋就是萬用字元是系統命令使用,一般用來匹配檔名或者什麼的用在系統命令中。而正規表示式是操作字串,以行尾單位來匹配字串使用的。
需要了解到的術語:
定界符:通常使用 "/"做為定界符開始和結束,也可以使用"#"。
例:$regex =
'/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html$/i'
;
字元域: [\w]用方括號擴起來的部分就是字元域。
修飾符:用於改變正規表示式的行為。
限定符:如[\w]或者[\w]*或者[\w]+這些[\w]後面的符號都表示限定符。
脫字元:^
放在字元域(如:[^\w])中表示否定(不包括的意思)——「反向選擇」
放在表示式之前,表示以當前這個字元開始。(/^n/i,表示以n開頭)。
反向引用:
例項詳解:
零字寬度:
捕獲組與**獲組:
正規表示式 1 初識正規表示式
簡單地說,正規表示式就是一套處理字串的規則和方法,以行為單位對字串進行處理,通過特殊的符號的輔助,我們可以快速的過濾,替換某些特定的字串。運維工作中,會有大量訪問日誌,錯誤日誌,大資料。如何能夠快速的過濾出我們需要的內容,這就需要正規表示式。awk,sed,grep egrep 三劍客要想能工作的更...
正規表示式 1 正規表示式基礎
1.正規表示式基礎 正規表示式描述了一種字串匹配的模式,即可以使使用者通過一系列普通字元或特殊字元構建能夠明確描述文字字串的匹配模式,可以用來檢查某個字串是否含有某種子字串,將匹配的子字串做替換或者從某個字串中取出符合某個條件的子字串等。1.1 正規表示式的基本結構 乙個正規表示式就是由普通字元 如...
正規表示式(1)
正規表示式 正則 表示式提供了一種標準的 實用的方式,來分析文字檔案 搜尋並有選擇性地替換出現的紫字串或者文字模式。如果對正規表示式不熟悉的話,可以把它看作ms dos裡的萬用字元,用來指定一組檔案 比如 txt 或者看作sql查詢語句中配合like命令使用的特殊字元 select name,cit...