正規表示式

[size=medium][b]零寬斷言[/b][/size]

用於查詢在某些內容(但並不包括這些內容)之前或之後的東西，也就是說它們像\b,^,$那樣用於指定乙個位置，這個位置應該滿足一定的條件(即斷言)，因此它們也被稱為零寬斷言。最好還是拿例子來說明吧：

(?=exp)也叫零寬度正**先行斷言[2]，它斷言自身出現的位置的後面能匹配表示式exp。比如\b\w+(?=ing\b)，匹配以ing結尾的單詞的前面部分(除了ing以外的部分)，如查詢i'm singing while you're dancing.時，它會匹配sing和danc。

(?<=exp)也叫零寬度正回顧後發斷言[2]，它斷言自身出現的位置的前面能匹配表示式exp。比如(?<=\bre)\w+\b會匹配以re開頭的單詞的後半部分(除了re以外的部分)，例如在查詢reading a book時，它匹配ading。

假如你想要給乙個很長的數字中每三位間加乙個逗號(當然是從右邊加起了)，你可以這樣查詢需要在前面和裡面新增逗號的部分：((?<=\d)\d)+\b，用它對*********x進行查詢時結果是*********x

下面這個例子同時使用了這兩種斷言：(?<=\s)\d+(?=\s)匹配以空白符間隔的數字(再次強調，不包括這些空白符)

斷言用來宣告乙個應該為真的事實。正規表示式中只有當斷言為真時才會繼續進行匹配。

[size=medium][b]負向零寬[/b][/size]

如果我們只是想要確保某個字元沒有出現，但並不想去匹配它時怎麼辦？例如，如果我們想查詢這樣的單詞--它裡面出現了字母q，但是q後面跟的不是字母u,我們可以嘗試這樣：

\b\w*q[^u]\w*\b匹配包含後面不是字母u的字母q的單詞。但是如果多做測試(或者你思維足夠敏銳，直接就觀察出來了)，你會發現，如果q出單詞的結尾的話，像iraq,benq，這個表示式就會出錯。這是因為[^u]總要匹配乙個字元，所以如果q是單詞的最後乙個字元的話，後面的[^u]將會匹配q後面的單詞分隔符(可能是空格，或者是句號或其它的什麼)，後面的\w*\b將會匹配下乙個單詞，於是\b\w*q[^u]\w*\b就能匹配整個iraq fighting。負向零寬斷言能解決這樣的問題，因為它只匹配乙個位置，並不消費任何字元。，我們可以這樣來解決這個問題：\b\w*q(?!u)\w*\b。

零寬度負**先行斷言(?!exp)，斷言此位置的後面不能匹配表示式exp。例如：\d(?!\d)匹配三位數字，而且這三位數字的後面不能是數字；\b((?!abc)\w)+\b匹配不包含連續字串abc的單詞。

同理，我們可以用(?).*(?=<\/\1>)，這個表示式最能表現零寬斷言的真正用途。

乙個更複雜的例子：(?<=<(\w+)>).*(?=<\/\1>)匹配不包含屬性的簡單html標籤內裡的內容。(?<=<(\w+)>)指定了這樣的字首：被尖括號括起來的單詞(比如可能是)，然後是.*(任意的字串),最後是乙個字尾(?=<\/\1>)。注意字尾裡的\/，它用到了前面提過的字元轉義；\1則是乙個反向引用，引用的正是捕獲的第一組，前面的(\w+)匹配的內容，這樣如果字首實際上是的話，字尾就是了。整個表示式匹配的是和之間的內容(再次提醒，不包括字首和字尾本身)。

正規表示式

正規表示式正規表示式總結

正規表示式表示式

Linux正規表示式編寫正規表示式

正規表示式

正規表示式 正規表示式 總結

正規表示式 表示式

Linux正規表示式 編寫正規表示式

相關推薦

正規表示式正規表示式總結

正規表示式表示式

Linux正規表示式編寫正規表示式