正規表示式(regular expression)
正規表示式,又稱規則表示式
正規表示式通常被用來檢索、替換那些符合某個模式(規則)的文字。
概念
用事先定義好的一些特定字元、及這些特定字元的組合,組成乙個「規則字串」,這個「規則字串」用來表達對字串的一種過濾邏輯。
目的
給定乙個正規表示式和另乙個字串,我們可以達到如下的目的:
1. 給定的字串是否符合正規表示式的過濾邏輯(稱作「匹配」)
2. 可以通過正規表示式,從字串中獲取我們想要的特定部分。
例
最簡單的元字元是點,它能夠匹配任何單個字元(注意不包括換行符)。假定有個檔案test.txt包含以下幾行內容:
he is arat
he is in a rut
the food is rotten
i like root beer
正規表示式r.t匹配乙個r接著任何乙個字元再接著乙個t。
所以它將匹配檔案中的rat和rut,
而不能匹配rotten中的rot,因為正規表示式是大小寫敏感的。
要想同時匹配大寫和小寫字母,應該使用字元區間元字元(方括號)。
正規表示式[rr]能夠同時匹配r和r。
所以,要想匹配乙個大寫或者小寫的r接著任何乙個字元再接著乙個t就要使用這個表示式:[rr].t。
匹配行首的字元要使用抑揚字元(^)
例如,想找到text.txt中行首"he"打頭的行,你可能會先用簡單表示式he,但是這會匹配第三行的the,所以要使用正規表示式^he,它只匹配在行首出現的he
當抑揚字元(^)出方括號中時,它表示「排除」,例如要匹配he ,但是排除前面是t or s的情形(也就是the和she),可以使用:[^st]he
可以使用方括號來指定多個字元區間。
例如正規表示式[a-za-z]匹配任何字母,包括大寫和小寫的
想匹配所有10和100的例項而排除1和 1000,可以使用:10\,這個正規表示式匹配數字1後面跟著1或者2個0的模式。
.
[ ]
^
$
四個字元是所有語言都支援的正規表示式
正規表示式 1 初識正規表示式
簡單地說,正規表示式就是一套處理字串的規則和方法,以行為單位對字串進行處理,通過特殊的符號的輔助,我們可以快速的過濾,替換某些特定的字串。運維工作中,會有大量訪問日誌,錯誤日誌,大資料。如何能夠快速的過濾出我們需要的內容,這就需要正規表示式。awk,sed,grep egrep 三劍客要想能工作的更...
正規表示式 1 正規表示式基礎
1.正規表示式基礎 正規表示式描述了一種字串匹配的模式,即可以使使用者通過一系列普通字元或特殊字元構建能夠明確描述文字字串的匹配模式,可以用來檢查某個字串是否含有某種子字串,將匹配的子字串做替換或者從某個字串中取出符合某個條件的子字串等。1.1 正規表示式的基本結構 乙個正規表示式就是由普通字元 如...
正規表示式(1)
正規表示式 正則 表示式提供了一種標準的 實用的方式,來分析文字檔案 搜尋並有選擇性地替換出現的紫字串或者文字模式。如果對正規表示式不熟悉的話,可以把它看作ms dos裡的萬用字元,用來指定一組檔案 比如 txt 或者看作sql查詢語句中配合like命令使用的特殊字元 select name,cit...