參考文件 正規表示式必知必會 ben forta著 楊濤譯
一、 正規表示式用途 搜尋和替換 正規表示式是用來匹配和處理文字的字串
二、 元字元分為兩種, 一種匹配文字的(例如. *), 一種是正規表示式語法所要求的(例如)。這些元字元要匹配自己本事需要轉義"\"
空白元字元
「貪婪型」元字元,進行匹配時是」多多益善而不是適可而止」
」懶惰型」元字元,進行匹配時是「匹配盡可能少的字元」
五、位置匹配
\bcat\b \b用來匹配完整的單詞,\b只匹配乙個位置,單詞邊界,不匹配任何字元
\b 不匹配單詞邊界
子表示式
子表示式的作用是把同乙個表示式的各個相關部分組合在一起,對重複次數元字元的作用物件作出京珠的設定和控制、對"|"操作的or條件作出準確的定義
子表示式將多個元素作為乙個元素處理,用(),例如(abc)指必須匹配abc的字串,abc作為獨立元素,相當於乙個元素
子表示式中的或用"|",例如(19|20) 指的是19或20
子表示式回溯引用
小結:使用元字元
[\w.]+@[\w.]+\.\w 匹配合法電子郵箱位址
[1-9][\d][\-]\d[\-]\d
匹配ip位址
(([1-9]|[1-9][0-9]|1\d|2[0-4][0-9]|25[0-5])\.)([1-9]|[1-9][0-9]|1\d|2[0-4][0-9]|25[0-5])
一位數字非0
兩位數字,第一位不是零
1開頭的任意三位數字
2開頭的,第二位在0-4之前的任意三位數字
25開頭的,第三位在0-5之間的三位數字
匹配重複次數
+ 匹配前面的字元或字元集合一次或多次
* 匹配前面的字元或字符集和集合零次或多次
? 匹配前面的字元或字元集合零次或一次
匹配前面的字元或字元集合具體次數
匹配前面的字元或字元集合至少多少次
匹配前面的字元或字元集合最多多少次
在字元集合中[.+] 不需要轉義,預設是普通字元
位置匹配
\bcat\b \b用來匹配完整的單詞,\b只匹配乙個位置,單詞邊界,不匹配任何字元
\b 不匹配單詞邊界
^ 只在中,緊跟[後面時,是非的意思,在字元集合外面,並位於乙個模式的開頭,^將匹配字串的開頭
$ 匹配字串或字元集合的結尾
子表示式
(),例如(19|20|21)\d 指的是以19、20、21開頭的四位數字
表示式的回溯引用 前後一致引用
+(\w+)+\1 \1代表第乙個子表示式() \2代表第二個子表示式 我們可以把回溯引用理解為變數 \0 代表整個正規表示式
正則中 、() 、{}區別
指匹配其中乙個即可,例如[abc],只要匹配abc中的乙個字母就可以
() 將()中的表示式看做乙個元素,例如(abc)指匹配到abc的字串
{} 指的是前面表示式匹配的次數
正規表示式基礎用法
正規表示式 regular expression 描述了一種字串匹配的模式 pattern 可以用來檢查乙個串是否含有某種子串 將匹配的子串替換或者從某個串中取出符合某個條件的子串等。字元含義示例 匹配任意長度的字串 匹配長度為1的字串 匹配除換行符以外的任意字元 匹配字串 一行 的開始 匹配字串 ...
正規表示式基礎用法總結
正規表示式概述 專門描述字串中字元出現規則的表示式 1 用途 1 驗證字串格式 2 查詢 遮蔽敏感詞 2 字符集 3 預定義字符集 字符集的最簡化寫法 d 一位數字 0 9 w 匹配一位字母 數字或 s 可匹配空格 製表符tab等空白 匹配所有文字 萬用字元 4 數量詞 如果規定乙個字符集或子規則反...
正規表示式基礎用法總結
匹配除換行符以外的任意字元 w 匹配字母或數字或下劃線或漢字 s 匹配任意的空白符 d 匹配數字 b 匹配單詞的開始或結束 一般用於校驗整個字串 匹配字串的開始 整個字串最開頭 匹配字串的結束 整個字串最後 如果你想查詢元字元本身的話,比如你查詢.或者 就出現了問題 你沒辦法指定它們,因為它們會被解...