[abc]是a或b或c
[a-z?._!]中只有連字元-是元字元,其他都是普通字元
但^在字元組的開頭表示排除,例如[^1-6]匹配除了1到6以外的任何字元
注意:|在字元組中只是乙個普通的符號
例如:[a|e]
有括號時(學術上叫多選結構)使用^和$時也要小心
例如:^from|subject|date:和^(from|subject|date):區別就很大
第二個是匹配以from或者subject或者date開頭後邊都有:的文字
元字串行:例如』\<』和』>』用來匹配單詞分界的位置,簡單點說就是匹配單詞,這兩套符號也可以分開來用,例如'\'
匹配以cat開頭或結束的單詞
但請注意』<』 『>』這兩個本身並不是元字元,只有當它們與斜線結合起來的時候,整個序列才具有特殊意義。
並不是所有的egrep都支援單詞分界符
單詞分界符不光是按空格來區分單詞的結束,連線符也是單詞的結束標誌,例如:
this is a telone-phone number
其中telone-phone是兩個單詞
單詞的開始和結束準確的說是字母數字符號的開始和結束,(細節處看《精通正規表示式》電子書第43頁
多選項沒有像字元組那樣的排除功能,多選項的連字元也只是個普通字元
『html*』和』html *』是不一樣的,前者匹配到』html』,後者匹配到』html 』
更經典的例子:
=14>
正規表示式要寫成
是匹配不成功的,
寫成這樣才能匹配成功
《精通正規表示式》筆記
1.多選結構 mm gg 表示匹配 mm 或 gg 2.忽略大小寫 s source dest i 搜尋source,將其替換為dest,此處的i只對source起作用,而不會作用於dest。3.單詞分界符 用來匹配單詞的開始 用來匹配單詞的結束 比如 cat 匹配以 cat 結尾的單詞,如scat...
精通正規表示式
我只看了前面兩三章 這書的核心是4 5 6章 精通正規表示式 這本書的第四章和第六章比較值得看 1.多選結構 mm gg 表示匹配 mm 或 gg 2.忽略大小寫 s source dest i 搜尋source,將其替換為dest,此處的i只對source起作用,而不會作用於dest。3.單詞分界...
精通正規表示式 1 正規表示式入門
1 能檢查多個檔案,挑出包含重複單詞的行,高亮標記每個重複單詞 使用標準ansi的轉義字元列 同時必須顯示這行文字來自哪個檔案。2 能跨行查詢,即使兩個單詞乙個在某行末尾而另乙個在下一行的開頭,也算重複單詞。3 能進行不區分大小寫的查詢,例如 the the.重複單詞之間可以出現任意數量的空白字元 ...